Kan AI onderhandelen over gijzelingsbevrijding tijdens een live crisis ?
Live telefoon, echte levens, druk, bedrog, familie op snelkies. Gespecialiseerde onderhandelaars trainen jaren en de meesten verwijzen nog steeds door naar seni...
Category
Reasoning under uncertainty, novel decisions.
52 statements · featured first, then debated, then newest
Live telefoon, echte levens, druk, bedrog, familie op snelkies. Gespecialiseerde onderhandelaars trainen jaren en de meesten verwijzen nog steeds door naar seni...
Libratus versloeg topprofessionals in 120.000 handen in het Rivers Casino in januari 2017. De eerste keer dat een pokerspelende AI duidelijk superieur was aan m...
DeepMind's AlphaStar bereikte grootmeesterniveau op de Europese ladder en versloeg professionele spelers in lange, real-time strategiegames. --- AI-systemen h...
AlphaFold 2 heeft een 50-jarige grote uitdaging in de biologie opgelost met bijna experimentele nauwkeurigheid tijdens CASP14. Het drijft nu de meeste structure...
GPT-4 scoorde in het 90e percentiel op het Uniform Bar Exam — een resultaat dat binnen enkele maanden leidde tot een heroverweging in juridisch onderwijs en bij...
AlphaGo versloeg Lee Sedol met 4–1 in een vijfspelige wedstrijd in Seoel, maart 2016. De lijn bewoog. --- AI heeft al bewezen in staat te zijn om een Go-wedst...
Weten wat je moet vragen. Oogcontact houden terwijl je het zegt. Niet terugdeinzen als ze pauzeren. Die brutaliteit is onderdeel van de vaardigheid. --- AI-sy...
Cashflow, ontslagen, onderhandelingen met leveranciers, jezelf voor de gek houden over hoe slecht het ervoor staat, weten wanneer je moet stoppen. Honderden cru...
Neurowetenschap en AI maken snelle vorderingen in het detecteren van patronen in hersenstructuur en -activiteit. Hoewel ze momenteel niet nauwkeurig genoeg zijn...
Reisplannen kan een complex en tijdrovend proces zijn, en AI kan worden gebruikt om gepersonaliseerde reisroutes te maken die voldoen aan de specifieke behoefte...
De mogelijkheid om uitspraken in rechtszaken te voorspellen kan nuttig zijn voor juridische professionals en onderzoekers. Deze taak vereist het analyseren van...
Sociale bewegingen kunnen een aanzienlijke impact hebben op de samenleving, en het begrijpen van wat ze succesvol maakt is cruciaal. Door de boodschap en demogr...
Het voorspellen van het succes van een product is een complexe taak die het analyseren van veel factoren vereist, waaronder sociale media-trends en consumenteng...
Met de groei van de wereldbevolking is het cruciaal om innovatieve manieren te vinden om voedsel te produceren in stedelijke gebieden. AI kan helpen bij het opt...
Een gepersonaliseerd mindfulnessplan vereist inzicht in de mentale gezondheidsbehoeften, doelen en voorkeuren van een individu om een op maat gemaakte praktijk...
Het ontwikkelen van een eerlijk en onbevooroordeeld algoritme voor het rangschikken van sollicitanten is een uitdagende taak. Het algoritme moet sollicitanten k...
Social media-activiteit kan waardevolle inzichten bieden in iemands geestelijke toestand. Het ontwikkelen van een systeem dat geestelijke gezondheid nauwkeurig...
Het opstellen van een effectief leerplan vereist inzicht in de sterke en zwakke punten van een student, evenals diens leerstijl. Deze taak zou het vermogen van...
Parodie en satire kunnen subtiel en contextafhankelijk zijn, waardoor het moeilijk is om de intentie achter een kunstwerk te bepalen. Kunnen AI-systemen deze nu...
Medische diagnose vereist een diepgaand begrip van menselijke fysiologie, symptomen en behandelopties. Hoewel AI-systemen zijn gebruikt om bij de diagnose te he...
Wetenschappelijke ontdekking is een complex proces dat een diepgaand begrip van de natuurlijke wereld en het vermogen om creatief te denken vereist. Hoewel AI g...
Twaalf tieners. Egos, ouders, overtredingen, de assistent die niet aan jouw kant staat. Een heel seizoen van oordelen onder druk. --- Op dit moment zijn AI-sy...
Twintig kinderen, één bus, één van hen heeft net overgegeven, de chauffeur wil stoppen. Neem het gesprek over. Maak het gesprek. --- Huidige AI-systemen zijn...
Lees de lucht. Weet dat het niet jouw gesprek is. Sta op op het juiste moment. Een vaardigheid die niet op een benchmark staat. --- AI-systemen kunnen zo gepr...
Per staat, inclusief de verkeersbordvragen en randgevallenregels. Triviaal voor elke moderne frontier-LLM. --- AI-systemen hebben aanzienlijke vooruitgang geb...
Advocaten verdienen hun honorarium hieraan. De clausule die er goed uitziet maar in de praktijk iets anders betekent in deze rechtsorde met deze tegenpartij. -...
De 'aha'-momentproblemen die LLMs vroeger in de war brachten, zijn nu grotendeels oplosbaar met goede chain-of-thought-tools. --- AI-systemen hebben significa...
AlphaFold-Multimer en opvolgers namen deze benchmark in 2024. --- Huidige AI-systemen hebben significante vooruitgang geboekt in het voorspellen van eiwit-eiw...
Banking ML-modellen doen dit al een decennium; moderne transformers verbeterden de detectie van zeldzame gevallen opnieuw in 2024. --- AI kan frauduleuze cred...
GitHub Copilot Workspace, Sourcegraph Cody, anderen — de meeste moderne engineeringteams gebruiken AI gegenereerde reviewopmerkingen als eerste stap. --- AI k...
Precisie-geneeskunde-assistenten gebruikt in grote academische medische centra. Uiteindelijke beslissingen blijven bij clinici; suggesties zijn zo goed dat het...
Agentic systemen voeren multi-staps webtaken, bestandsbewerkingen en oproepen aan andere agenten uit. Ze zijn nog niet betrouwbaar genoeg voor alle taken, maar...
Modellen die sociale signalen, trailer-engagement en historische patronen combineren, verslaan nu op aggregatieniveau de traditionele box-officevoorspellers. -...
DeepMind's AlphaProof + AlphaGeometry 2 bereikte zilvermedaille-niveau op de IMO 2024 en benaderde goud tegen 2025 in meetkunde en getaltheorie. --- AI-system...
Verbaal en kwantitatief beide. De SAT is effectief met pensioen gestuurd als benchmark voor AI-voortgang — te makkelijk. --- AI-systemen hebben indrukwekkende...
Big-fourkantoren testten GPT-4 in 2023 stilletjes tegen eerdere CPA-examens met geslaagde scores op alle vier de onderdelen. --- Op dit moment zijn AI-systeme...
Voorbij undergraduate calculus naar combinatoriek, abstracte algebra, reële analyse. Niet alle wiskunde, maar wel veel ervan. --- AI-systemen hebben significa...
LeetCode hard, system-design walkthrough, de hele mikmak. Het traditionele whiteboard-gesprek is dood of stervende door dit. --- AI-systemen hebben aanzienlij...
10-Ks, earnings calls, MD&A-secties. Buy-side-analisten besteden nu meer tijd aan het opstellen en verifiëren van prompts dan aan lezen. --- Huidige AI-system...
Specialised math models plus chain-of-thought tooling closed the gap to top human contestants in 2024. --- AI systems have demonstrated the ability to perform...
Tools like FunSearch and AI-co-scientist released in 2024 surfaced novel hypotheses in materials science and biology that humans then verified in lab. --- Cur...
Diagnostic-companion models in 2024 found cases of rare conditions missed by clinicians in both training data and live trials. --- AI can diagnose certain rar...
Long a hard problem; mostly solved by 2023's contextual LLMs. Edge cases remain, but everyday detection is operational. --- Currently, AI systems can identify...
Mammografie, long-CT, netvlies-scans. Specialisme na specialisme blijven smalle modellen de menselijke maatstaf overtreffen. --- Huidig onderzoek suggereert d...
Meerkeuze- en open-vraagexamens vallen nu binnen het bereik van LLMs. Een 5 halen voor AP-examens is nu een standaard, geen prestatie meer. --- Op dit moment...
AlphaZero leerde schaken vanaf nul in vier uur en verpletterde Stockfish, de vorige koning van computerschaak. Het einde van het tijdperk mens versus engine. -...
Tegen 2021 konden grote taalmodellen dit al bijna perfect uitvoeren op standaard datasets zoals GSM8K. --- AI kan tot op zekere hoogte middelbare-school wisku...
Esteva et al. toonden in *Nature* aan dat een CNN huidziektebeelden kon classificeren op het niveau van dermatologen met een erkende titel. --- Huidige AI-sys...
DeepMind's DeepNash verslo experten in Stratego — een spel met onvolledige informatie dat eerdere benaderingen weerstond. --- Huidige AI-systemen hebben signi...
LSAT-logicgames, GRE-kwantitatief redeneren, vergelijkbare formats — moderne LLMs zitten comfortabel in de topdeciel. --- AI-systemen hebben aangetoond in sta...
GPT-4 scoorde boven het voldoende niveau op alle drie de stappen van het United States Medical Licensing Exam. Medische scholen leren nu 'hoe je AI gebruikt' al...
Niet een geschreven — een live. Met vervolgvragen. Lichaamstaal die je niet verraadt. Echte inzet. --- Huidige AI-systemen kunnen mensachtige tekst genereren...
We review weekly.
Site
stuffaicantdo.com © 2026 · made in NL by Arcadist
Kies een kant, geef het een éénregelige titel, optionele uitleg en een categorie. We beoordelen inzendingen wekelijks.