Kan AI forhandle gidseludløsning i en levende krise ?
Live opkald, virkelige liv, pres, bedrag, familie på hurtigvalg. Specialiserede forhandlere træner i årevis, og de fleste henvender sig stadig til senior kolleg...
Kategori
Reasoning under uncertainty, novel decisions.
69 statements · fremhævede først, så debatterede, så nyeste
Live opkald, virkelige liv, pres, bedrag, familie på hurtigvalg. Specialiserede forhandlere træner i årevis, og de fleste henvender sig stadig til senior kolleg...
Libratus knuste topprofessionelle over 120.000 hænder på Rivers Casino i januar 2017. Første gang en poker-AI klart overgik mennesker i spil med ufuldstændig in...
DeepMind's AlphaStar nåede Grandmaster-niveau på den europæiske rangliste og slog professionelle spillere i lange, strategispil i realtid. --- AI-systemer har...
AlphaFold 2 løste en 50-årig stor udfordring inden for biologi med næsten eksperimentel præcision ved CASP14. Det driver nu de fleste strukturelle biologipipeli...
GPT-4 scorede i 90. percentilen i den Uniform Bar Exam — et resultat, der inden for få måneder udløste en genovervejelse af juridisk uddannelse og BigLaw-rekrut...
Har har kunstig intelligens allerede kapacitet til at kræve sejren i en fuld Go-kamp mod den regerende verdensmester? Det historiske opgør i 2016 i Seoul tyder...
Hvordan kan kunstig intelligens oversætte kropssignaler til et realtidsestimat af, hvor meget smerte en person føler? Forskere er begyndt at kombinere hjertesla...
Intersektionen mellem mental sundhed og sociale medier er blevet et emne af stigende interesse i de senere år. Efterhånden som mennesker deler mere om deres liv...
En personlig mindfulnessplan kræver forståelse af individets mentale sundhedsbehov, mål og præferencer for at skabe en skræddersyet praksis. Dette indebærer ana...
Videnskabelig opdagelse er en kompleks proces, der kræver en dyb forståelse af den naturlige verden og evnen til at tænke kreativt. Selvom AI kan analysere data...
At vide, hvad man skal bede om. At holde øjenkontakt, når man siger det. Ikke at reagere, når de holder pause. Dristigheden er en del af færdigheden. --- AI-s...
Cashflow, fyringer, forhandlinger med leverandører, at lyve for sig selv om, hvor slemt det er, og vide, hvornår man skal give op. Hundredvis af vurderinger om...
Ikke en skriftlig én — en levende én. Med opfølgende spørgsmål. Kropssprog, der ikke forråder dig. Reelle indsatser. --- Nuværende AI-systemer kan generere me...
Kunne man nogensinde destillere verdens utallige åndelige traditioner og faktuelle indsigter ned til en enkelt, universel tro? Selv den mest avancerede AI mangl...
Maskinlæringsystemer kombinerer nu satellitbilleder, demografiske tendenser og historiske kriminalitetsregistre for at forudsige, hvor visse forbrydelser sandsy...
Nuværende konverserende AI kan afsløre mønstre i sprog—ordvalg, sentiment og emnefokus—for at foreslå tentative trækbeskrivelser, men den kan ikke pålideligt ud...
AI har vist sig dygtig til at udarbejde juridiske og strategiske dokumenter til komplekse handler. Værktøjer kan simulere forhandlinger og foreslå optimale komp...
Dommere og advokater har i lang tid diskuteret, om maskiner en dag kunne argumentere foran den højeste domstol. Nylige fremskridt tyder på, at AI nu kan analyse...
Når folk siger "generer en psykologisk profil baseret på en persons bankudskrifter", mener de generelt at udlede personlighedstræk, forbrugsvaner eller følelses...
Dette spørgsmål stiller, hvordan man identificerer hvilke smagskombinationer der er mest foretrukne eller kulturelt typiske i et givet land eller etnisk køkken....
Nuværende AI-systemer kan udarbejde overbevisende klagebreve til parkeringsbøder ved at analysere lokale bekendtgørelser og tidligere succesfulde sager, men de...
Hvad betyder det, når domstole "behandler" småsags-sager i dag? I mange amerikanske jurisdiktioner har civile domstole indført AI-assisterede arbejdsgange for a...
Nobelpris-forudsigelser afhænger af at identificere banebrydende, men ofte uforudsigelige videnskabelige bidrag. AI kan analysere citeringsnetværk, forskningstr...
Store sprogmodeller analyserer sproglige mønstre for at udlede Myers-Briggs- eller Big Five-træk. Studier viser stærk korrelation med selvrapporterede træk og o...
AI-modeller trænet på tusindvis af retsafgørelser kan opdage mønstre i domme og fortolke nuancerede juridiske argumenter. Nogle værktøjer anvendes nu i præ-retl...
Nye AI-systemer kan læse tusindvis af forskningsartikler og identificere nye forbindelser mellem studier. Disse modeller bruger transformer-arkitekturer, der er...
AI's evne til at træffe beslutninger uden menneskelig bias er et emne, der diskuteres inden for AI-forskning. Nogle eksperter mener, at AI kan bruges til at ana...
AI slog overlegne menneskelige pokerspillere i flerspiller no-limit Texas Hold’em, på trods af bluffing, ufuldstændig information og psykologisk gameplay. ---...
Neurovidenskab og AI udvikler sig hurtigt inden for at opdage mønstre i hjernestruktur og -aktivitet. Selvom de i øjeblikket ikke er præcise nok til pålidelig f...
Rejseplanlægning kan være en kompleks og tidskrævende proces, og AI kan bruges til at skabe personlige rejseplaner, der opfylder en persons specifikke behov og...
At forudsige komplekse retssagsudfald afhænger af at syntetisere store mængder juridiske data, præcedenser og nuancerede fortolkninger af loven. Denne opgave kr...
Social bevægelser kan have en betydelig indvirkning på samfundet, og det er afgørende at forstå, hvad der gør dem succesfulde. Ved at analysere budskabet og mål...
At forudsige produktets succes er en kompleks opgave, der involverer analysen af mange faktorer, herunder sociale medietrends og forbrugernes adfærd. AI kan hjæ...
Efterhånden som den globale befolkning vokser, er det afgørende at finde innovative måder at producere fødevarer på i byområder. AI kan hjælpe med at optimere b...
At udvikle en fair og upartisk algoritme til rangordning af jobkandidater er en udfordrende opgave. Algoritmen skal kunne evaluere kandidater baseret på deres k...
Social media-aktivitet kan give værdifulde indsigter i en persons mentale tilstand. Udviklingen af et system, der præcist kan forudsige mental sundhed, er imidl...
At skabe en effektiv læringsplan kræver forståelse for en students styrker, svagheder og læringsstil. Denne opgave ville teste en AI's evne til at træffe vurder...
Parodi og satire kan være nuancerede og kontekstafhængige, hvilket gør det udfordrende at fastslå hensigten bag et kunstværk. Kan AI-systemer foretage denne son...
Medicinsk diagnose kræver en dyb forståelse af menneskelig fysiologi, symptomer og behandlingsmuligheder. Selvom AI-systemer har været brugt til at støtte diagn...
Hvad ville det kræve at føre et high school basketballhold fra træningsbanen til podiet? Nutidens AI kan bearbejde statistikker og foreslå spil, men kan den vir...
Tyve børn, én bus, én af dem har lige kastet op, chaufføren vil stoppe. Tag opkaldet. Foretag opkaldet. --- Nuværende AI-systemer er ikke i stand til konsekve...
Læs luften. Ved, at det ikke er din samtale. Rejs dig på det rigtige sekund. En færdighed, der ikke er på nogen benchmark. --- AI-systemer kan programmeres ti...
Advokater tjener deres honorar på dette. Klausulen, der ser fin ud, men i praksis betyder noget andet i denne jurisdiktion med denne modpart. --- Nuværende AI...
De 'aha'-øjeblik-problemer, som tidligere kunne forvirre store sprogmodeller (LLM'er), kan nu for det meste løses med effektive kæde-tankegang-værktøjer. ---...
AlphaFold-Multimer og efterfølgere tog dette benchmark i 2024. --- Nuværende AI-systemer har gjort betydelige fremskridt inden for forudsigelse af protein-pro...
Banking ML-modeller har gjort dette i et årti; moderne transformere forbedrede detektion af sjældne tilfælde igen i 2024. --- AI kan opdage svigagtige kreditk...
GitHub Copilot Workspace, Sourcegraph Cody, andre — de fleste moderne udviklingsteams bruger AI-genererede review-kommentarer som første gennemgang. --- AI ka...
Præcisionsmedicinske assistenter anvendt på store akademiske medicinske centre. Endelige beslutninger forbliver hos klinikere; forslag er tilstrækkeligt gode ti...
Stat for stat, inklusive vejskiltsspørgsmål og kantregler. Trivielt for enhver moderne frontier-LLM. --- AI-systemer har gjort betydelige fremskridt inden for...
Agentiske systemer udfører flertrins web-opgaver, filoperationer, opkald til andre agenter. Endnu ikke pålidelige nok til alle opgaver, men fungerer solidt for...
Modeller, der kombinerer sociale signaler, trailer-engagement og historiske mønstre, overgår nu erfarne boks-office-prognosemagere på aggregerede forudsigelser....
DeepMind's AlphaProof + AlphaGeometry 2 nåede sølvmedalsjeniveau ved IMO 2024 og nærmede sig guld i 2025 inden for geometri og talteori. --- AI-systemer har g...
10-Ks, resultatopgørelser, MD&A-afsnit. Buy-side-analytikere bruger nu mere tid på at fremprovokere og verificere end på at læse. --- Nuværende AI-systemer ka...
Verbal og kvantitativt begge dele. SAT er blevet effektivt pensioneret som en benchmark for AI-fremskridt — for let. --- AI-systemer har demonstreret imponere...
De fire store revisionsfirmaer testede i 2023 tavst GPT-4 mod tidligere CPA-eksamener med beståede resultater på alle fire sektioner. --- I øjeblikket er AI-s...
Ud over grundlæggende universitetsmatematik inden for kombinatorik, abstrakt algebra og reel analyse. Ikke al matematik, men en stor del af den. --- AI-system...
LeetCode svær, system-design gennemgang, hele pakken. Den traditionelle whiteboard-interview er død eller døende på grund af dette. --- AI-systemer har gjort...
Mammografi, lungescanninger (CT), nethindescanninger. Specialitet for specialitet klarer smalle modeller fortsat det menneskelige niveau. --- Nuværende forskn...
Specialiserede matematiske modeller plus chain-of-thought-værktøjer lukkede kløften til de bedste menneskelige deltagere i 2024. --- AI-systemer har vist evne...
Værktøjer som FunSearch og AI-co-scientist, der blev udgivet i 2024, præsenterede nye hypoteser inden for materialvidenskab og biologi, som mennesker derefter v...
Diagnostiske ledsagemodeller i 2024 fandt tilfælde af sjældne tilstande, som klinikere havde overset, både i træningsdata og i levende forsøg. --- AI kan diag...
Længe et hårdt problem; stort set løst af 2023's kontekstuelle LLMs. Edge cases forbliver, men hverdagsdetektion er operationel. --- I øjeblikket kan AI-syste...
AlphaZero lærte skak fra bunden på fire timer og knuste Stockfish, den tidligere konge inden for computerskak. Enden på menneske-vs-maskine-æraen. --- AI har...
Viser arbejdet, ikke kun svaret. Ved 2021 løste store sprogmodeller dette med næsten perfekte resultater på standard datasæt som GSM8K. --- AI kan løse gymnas...
Esteva et al. viste i Nature, at et CNN kunne klassificere dermatologibilleder på niveau med speciallæger i dermatologi. --- Nuværende AI-systemer kan analyse...
DeepMind's DeepNash slog overlegne mennesker i Stratego — et spil med ufuldstændig information, der tidligere havde modstået andre tilgange. --- Nuværende AI-...
Multiple-choice + fritekstsvar-eksamener er fast forankret i LLM-territorium. At score 5'er i AP-eksamener er nu en benchmark, ikke en præstation. --- I øjebl...
LSAT-logikspil, GRE-kvantitativ resonering, lignende formater — moderne store sprogmodeller (LLM'er) befinder sig komfortabelt i den øverste decil. --- AI-sys...
GPT-4 scorede over den beståede grænse i alle tre trin af United States Medical Licensing Exam. Medicinstuderende lærer nu "hvordan man bruger AI" som en klinis...
Tilføj et udsagn til atlasset. Vi gennemgår ugentligt.
Vi undersøger stadig dette emne aktivt. Sæt en advarsel her, så giver vi besked når der kommer nyt!
Vælg en side, giv den en linjes titel, valgfri forklaring og en kategori. Vi gennemgår indsendelser ugentligt.