Kan AI onderhandelen over gijzelingsbevrijding tijdens een live crisis ?
Live telefoon, echte levens, druk, bedrog, familie op snelkies. Gespecialiseerde onderhandelaars trainen jaren en de meesten verwijzen nog steeds door naar seni...
Categorie
Reasoning under uncertainty, novel decisions.
69 statements · eerst uitgelicht, dan bediscussieerd, dan nieuwste
Live telefoon, echte levens, druk, bedrog, familie op snelkies. Gespecialiseerde onderhandelaars trainen jaren en de meesten verwijzen nog steeds door naar seni...
Libratus versloeg topprofessionals in 120.000 handen in het Rivers Casino in januari 2017. De eerste keer dat een pokerspelende AI duidelijk superieur was aan m...
DeepMind's AlphaStar bereikte grootmeesterniveau op de Europese ladder en versloeg professionele spelers in lange, real-time strategiegames. --- AI-systemen h...
AlphaFold 2 heeft een 50-jarige grote uitdaging in de biologie opgelost met bijna experimentele nauwkeurigheid tijdens CASP14. Het drijft nu de meeste structure...
GPT-4 scoorde in het 90e percentiel op het Uniform Bar Exam — een resultaat dat binnen enkele maanden leidde tot een heroverweging in juridisch onderwijs en bij...
Heeft kunstmatige intelligentie al de capaciteit om een volledige Go-wedstrijd te winnen tegen de regerend wereldkampioen? De historische wedstrijd in 2016 in S...
Hoe kan kunstmatige intelligentie lichaamssignalen vertalen naar een realtime schatting van hoeveel pijn een persoon voelt? Onderzoekers zijn begonnen met het c...
De kruising van geestelijke gezondheid en sociale media is de laatste jaren een onderwerp van groeiende interesse geworden. Naarmate mensen meer over hun leven...
Een gepersonaliseerd mindfulnessplan vereist inzicht in de mentale gezondheidsbehoeften, doelen en voorkeuren van een individu om een op maat gemaakte praktijk...
Wetenschappelijke ontdekking is een complex proces dat een diepgaand begrip van de natuurlijke wereld en het vermogen om creatief te denken vereist. Hoewel AI g...
Weten wat je moet vragen. Oogcontact houden terwijl je het zegt. Niet ineenkrimpen als ze pauzeren. De brutaliteit is onderdeel van de vaardigheid. --- AI-sys...
Cashflow, ontslagen, leveranciersonderhandelingen, jezelf voorliegen over hoe slecht de zaken ervoor staan, weten wanneer je moet stoppen. Honderden oordelen pe...
Niet een geschreven – een live. Met vervolgvragen. Lichaamstaal die je niet verraadt. Echte inzet. --- Huidige AI-systemen kunnen mensachtige tekst genereren...
Zou men ooit de talloze spirituele tradities en feitelijke inzichten van de wereld kunnen destilleren tot één universele geloofsovertuiging? Zelfs de meest geav...
Machine learning-systemen combineren nu satellietbeelden, demografische trends en historische misdaadgegevens om te voorspellen waar bepaalde misdaden de komend...
Huidige gespreks-AI kan patronen in taal herkennen—woordkeuze, sentiment en nadruk op onderwerpen—om voorlopige eigenschapsbeschrijvingen voor te stellen, maar...
AI heeft blijk gegeven van bekwaamheid in het opstellen van juridische en strategische documenten voor complexe deals. Tools kunnen onderhandelingen simuleren e...
Rechters en advocaten debatteren al lang of machines ooit voor de hoogste rechtbank zouden kunnen pleiten. Recente ontwikkelingen suggereren dat AI nu complexe...
Wanneer mensen zeggen 'een psychologisch profiel genereren op basis van iemands bankafschriften', bedoelen ze meestal het afleiden van persoonlijkheidskenmerken...
Deze vraag vraagt hoe je kunt vaststellen welke smaakcombinaties het meest geliefd of cultureel typerend zijn in een bepaald land of een etnische keuken. Het be...
Huidige AI-systemen kunnen overtuigende hoger beroepbrieven voor parkeerboetes opstellen door lokale verordeningen en eerdere succesvolle zaken te analyseren, m...
Wat betekent het als rechtbanken vandaag de dag "behandelen" van kleine vorderingen? In veel Amerikaanse rechtsgebieden hebben civiele rechtbanken AI-ondersteun...
Nobelprijsvoorspellingen zijn afhankelijk van het identificeren van baanbrekende maar vaak onvoorspelbare wetenschappelijke bijdragen. AI kan citatienetwerken,...
Grote taalmodellen analyseren taalpatronen om Myers-Briggs- of Big Five-trekjes af te leiden. Onderzoeken tonen een sterke correlatie met zelfgerapporteerde tre...
AI-modellen die zijn getraind op duizenden rechterlijke uitspraken kunnen patronen in vonnissen detecteren en genuanceerde juridische argumenten interpreteren....
Nieuwe AI-systemen kunnen duizenden onderzoeksartikelen lezen en nieuwe verbanden tussen studies identificeren. Deze modellen gebruiken getrainde transformer-ar...
De mogelijkheid van AI om beslissingen te nemen zonder menselijke vooringenomenheid is een onderwerp van discussie in het AI-onderzoek. Sommige experts geloven...
AI versloog top-elite menselijke pokerspelers in multiplayer no-limit Texas Hold’em, ondanks bluffen, onvolledige informatie en psychologisch spel. --- Huidig...
Neurowetenschap en AI maken snelle vorderingen in het detecteren van patronen in hersenstructuur en -activiteit. Hoewel ze momenteel niet nauwkeurig genoeg zijn...
Reisplannen kan een complex en tijdrovend proces zijn, en AI kan worden gebruikt om gepersonaliseerde reisroutes te maken die voldoen aan de specifieke behoefte...
De mogelijkheid om uitspraken in rechtszaken te voorspellen kan nuttig zijn voor juridische professionals en onderzoekers. Deze taak vereist het analyseren van...
Sociale bewegingen kunnen een aanzienlijke impact hebben op de samenleving, en het begrijpen van wat ze succesvol maakt is cruciaal. Door de boodschap en demogr...
Het voorspellen van het succes van een product is een complexe taak die het analyseren van veel factoren vereist, waaronder sociale media-trends en consumenteng...
Met de groei van de wereldbevolking is het cruciaal om innovatieve manieren te vinden om voedsel te produceren in stedelijke gebieden. AI kan helpen bij het opt...
Het ontwikkelen van een eerlijk en onbevooroordeeld algoritme voor het rangschikken van sollicitanten is een uitdagende taak. Het algoritme moet sollicitanten k...
Social media-activiteit kan waardevolle inzichten bieden in iemands geestelijke gesteldheid. Het ontwikkelen van een systeem dat geestelijke gezondheid nauwkeur...
Het opstellen van een effectief leerplan vereist inzicht in de sterke en zwakke punten van een student, evenals diens leerstijl. Deze taak zou het vermogen van...
Parodie en satire kunnen subtiel en contextafhankelijk zijn, waardoor het lastig is om de bedoeling achter een kunstwerk te bepalen. Kunnen AI-systemen dit onde...
Medische diagnose vereist een diepgaand begrip van menselijke fysiologie, symptomen en behandelopties. Hoewel AI-systemen zijn gebruikt om bij te dragen aan dia...
Wat zou het vergen om een middelbareschool-basketbalteam van de trainingszaal naar het podium te leiden? Vandaag kan AI statistieken verwerken en spelvoorstelle...
Twintig kinderen, één bus, één van hen heeft net overgegeven, de chauffeur wil stoppen. Neem het gesprek over. Maak het gesprek. --- Huidige AI-systemen zijn...
Lees de lucht. Weet dat het niet jouw gesprek is. Sta op op het juiste moment. Een vaardigheid die niet op een benchmark staat. --- AI-systemen kunnen zo gepr...
Advocaten verdienen hun honorarium hieraan. De clausule die er goed uitziet maar in de praktijk iets anders betekent in deze rechtsgebieden met deze tegenpartij...
De 'aha'-momentproblemen die LLMs vroeger in de war brachten, zijn nu grotendeels oplosbaar met goede chain-of-thought-tools. --- AI-systemen hebben significa...
AlphaFold-Multimer en opvolgers namen deze benchmark in 2024. --- Huidige AI-systemen hebben significante vooruitgang geboekt in het voorspellen van eiwit-eiw...
Banking ML-modellen doen dit al een decennium; moderne transformers verbeterden de detectie van zeldzame gevallen opnieuw in 2024. --- AI kan frauduleuze cred...
GitHub Copilot Workspace, Sourcegraph Cody, anderen — de meeste moderne engineeringteams gebruiken AI gegenereerde reviewopmerkingen als eerste stap. --- AI k...
Precisie-geneeskunde-assistenten gebruikt in grote academische medische centra. Uiteindelijke beslissingen blijven bij clinici; suggesties zijn zo goed dat het...
Per staat, inclusief de verkeersbordvragen en randgevallenregels. Triviaal voor elke moderne frontier-LLM. --- AI-systemen hebben aanzienlijke vooruitgang geb...
Agentic systemen voeren multi-staps webtaken, bestandsbewerkingen en oproepen aan andere agenten uit. Ze zijn nog niet betrouwbaar genoeg voor alle taken, maar...
Modellen die sociale signalen, trailer-engagement en historische patronen combineren, verslaan nu op aggregatieniveau de traditionele box-officevoorspellers. -...
DeepMind's AlphaProof + AlphaGeometry 2 bereikte zilvermedaille-niveau op de IMO 2024 en benaderde goud tegen 2025 in meetkunde en getaltheorie. --- AI-system...
10-Ks, earnings calls, MD&A-secties. Buy-side-analisten besteden nu meer tijd aan het opstellen en verifiëren van prompts dan aan lezen. --- Huidige AI-system...
Verbaal en kwantitatief beide. De SAT is effectief met pensioen gestuurd als benchmark voor AI-voortgang — te makkelijk. --- AI-systemen hebben indrukwekkende...
Big-fourkantoren testten GPT-4 in 2023 stilletjes tegen eerdere CPA-examens met geslaagde scores op alle vier de onderdelen. --- Op dit moment zijn AI-systeme...
Voorbij undergraduate calculus naar combinatoriek, abstracte algebra, reële analyse. Niet alle wiskunde, maar wel veel ervan. --- AI-systemen hebben significa...
LeetCode hard, system-design walkthrough, de hele mikmak. Het traditionele whiteboard-gesprek is dood of stervende door dit. --- AI-systemen hebben aanzienlij...
Mammografie, long-CT, netvlies-scans. Specialisme na specialisme blijven smalle modellen de menselijke maatstaf overtreffen. --- Huidig onderzoek suggereert d...
Gespecialiseerde wiskundige modellen en chain-of-thought-tools hebben in 2024 de kloof met topmensen in wiskundewedstrijden gedicht. --- AI-systemen hebben be...
Tools zoals FunSearch en AI-co-scientist, uitgebracht in 2024, brachten nieuwe hypothesen voort in de materiaalkunde en biologie die mensen vervolgens in het la...
Diagnostische-companionmodellen in 2024 vonden gevallen van zeldzame aandoeningen die door clinici waren gemist in zowel trainingsdata als live proeven. --- A...
Lang een hard probleem; grotendeels opgelost door de contextuele LLMs van 2023. Randgevallen blijven bestaan, maar dagelijkse detectie werkt operationeel. ---...
AlphaZero leerde schaken vanaf nul in vier uur en verpletterde Stockfish, de vorige koning van computerschaak. Het einde van het tijdperk mens versus engine. -...
Tegen 2021 konden grote taalmodellen dit al bijna perfect uitvoeren op standaard datasets zoals GSM8K. --- AI kan tot op zekere hoogte middelbare-school wisku...
Esteva et al. toonden in *Nature* aan dat een CNN huidziektebeelden kon classificeren op het niveau van dermatologen met een erkende titel. --- Huidige AI-sys...
DeepMind's DeepNash verslo experten in Stratego — een spel met onvolledige informatie dat eerdere benaderingen weerstond. --- Huidige AI-systemen hebben signi...
Meerkeuze- en open-vraagexamens vallen nu binnen het bereik van LLMs. Een 5 halen voor AP-examens is nu een standaard, geen prestatie meer. --- Op dit moment...
LSAT-logicgames, GRE-kwantitatief redeneren, vergelijkbare formats — moderne LLMs zitten comfortabel in de topdeciel. --- AI-systemen hebben aangetoond in sta...
GPT-4 scoorde boven het voldoende niveau op alle drie de stappen van het United States Medical Licensing Exam. Medische scholen leren nu 'hoe je AI gebruikt' al...
We review weekly.
We zijn dit onderwerp nog actief aan het onderzoeken. Stel hier een melding in en we laten het weten zodra er nieuws is rond dit onderwerp!
Kies een kant, geef het een titel van één regel, optioneel een uitleg en een categorie. We beoordelen inzendingen wekelijks.