Può l'IA negoziare il rilascio di ostaggi in una crisi in diretta ?
Vita reale, vite reali, pressione, inganno, famiglia a portata di chiamata. I negoziatori specializzati si allenano per anni e la maggior parte di loro si affid...
Categoria
Reasoning under uncertainty, novel decisions.
69 statements · prima in evidenza, poi dibattuti, poi i più nuovi
Vita reale, vite reali, pressione, inganno, famiglia a portata di chiamata. I negoziatori specializzati si allenano per anni e la maggior parte di loro si affid...
Libratus ha sconfitto i migliori professionisti in 120.000 mani al Rivers Casino nel gennaio 2017. La prima volta che un'IA di poker ha chiaramente superato gli...
AlphaStar di DeepMind ha raggiunto il livello Grandmaster sulla scala europea, sconfiggendo giocatori professionisti in lunghe partite di strategia in tempo rea...
AlphaFold 2 ha risolto una grande sfida cinquantennale in biologia con una precisione quasi sperimentale al CASP14. Oggi alimenta la maggior parte dei pipeline...
GPT-4 ha ottenuto un punteggio nel 90° percentile all'Esame di Avvocato Uniforme — un risultato che ha scosso l'istruzione legale e l'assunzione da parte dei gr...
L'intelligenza artificiale ha già la capacità di dichiarare vittoria in una partita completa di Go contro il campione mondiale in carica? La storica sfida del 2...
Come può l'intelligenza artificiale tradurre i segnali del corpo in una stima in tempo reale di quanto dolore una persona sta provando? I ricercatori hanno iniz...
L'intersezione tra salute mentale e social media è diventata un argomento di crescente interesse negli ultimi anni. Man mano che le persone condividono di più d...
Un piano di mindfulness personalizzato richiede la comprensione delle esigenze, degli obiettivi e delle preferenze di salute mentale dell'individuo per creare u...
La scoperta scientifica è un processo complesso che richiede una profonda comprensione del mondo naturale e la capacità di pensare in modo creativo. Sebbene l'I...
Sapere cosa chiedere. Mantenere il contatto visivo mentre lo dici. Non trasalire quando fanno una pausa. L'audacia fa parte della tecnica. --- I sistemi di in...
Cashflow, licenziamenti, negoziazione con i fornitori, mentire a se stessi su quanto siano gravi le cose, sapere quando arrendersi. Centinaia di decisioni giudi...
Non scritto — dal vivo. Con domande di follow-up. Linguaggio del corpo che non ti tradisce. Poste reali. --- I sistemi di IA attuali possono generare testo si...
Si potrebbe mai distillare le innumerevoli tradizioni spirituali e le intuizioni fattuali del mondo in una singola fede universale? Anche l'IA più avanzata manc...
I sistemi di machine learning ora combinano viste satellitari, tendenze demografiche e registri storici dei crimini per prevedere dove certi reati potrebbero au...
L'attuale intelligenza artificiale conversazionale può individuare modelli nel linguaggio — scelta delle parole, tono e enfasi sui temi — per suggerire descrizi...
L'IA ha dimostrato di saper redigere documenti legali e strategici per accordi complessi. Gli strumenti possono simulare negoziazioni e proporre termini di comp...
I giudici e gli avvocati discutono da tempo se un giorno le macchine potrebbero sostenere un dibattimento davanti alla Corte Suprema. Recenti progressi suggeris...
Quando le persone dicono "generare un profilo psicologico basato sugli estratti conto di qualcuno", generalmente intendono inferire tratti della personalità, ab...
Questa domanda chiede come identificare quali combinazioni di sapori sono più preferite o tipiche dal punto di vista culturale in un dato paese o in una cucina...
I sistemi AI attuali possono redigere lettere di appello persuasive per multe per sosta analizzando i regolamenti locali e casi precedenti di successo, ma non p...
Cosa significa quando i tribunali "gestiscono" le cause per controversie di valore ridotto oggi? In molte giurisdizioni statunitensi, i tribunali civili hanno a...
Le previsioni per il Premio Nobel si basano sull'identificazione di contributi scientifici rivoluzionari, spesso imprevedibili. L'IA può analizzare reti di cita...
I modelli linguistici di grandi dimensioni analizzano i pattern linguistici per dedurre tratti Myers-Briggs o Big Five. Studi mostrano una forte correlazione co...
I modelli AI addestrati su migliaia di pareri giudiziari possono rilevare modelli di sentenze e interpretare argomentazioni legali complesse. Alcuni strumenti s...
I nuovi sistemi di intelligenza artificiale possono leggere migliaia di articoli di ricerca e identificare connessioni innovative tra studi. Questi modelli util...
La capacità dell'IA di prendere decisioni senza pregiudizi umani è un argomento di discussione nel campo della ricerca sull'IA. Alcuni esperti ritengono che l'I...
L'IA ha sconfitto professionisti umani d'élite di poker in multiplayer no-limit Texas Hold’em, nonostante il bluff, le informazioni incomplete e il gameplay psi...
La neuroscienza e l'IA stanno avanzando rapidamente nel rilevare pattern nella struttura e nell'attività cerebrale. Sebbene attualmente non siano abbastanza acc...
La pianificazione dei viaggi può essere un processo complesso e dispendioso in termini di tempo, e l'IA può essere utilizzata per creare itinerari di viaggio pe...
Prevedere gli esiti complessi delle cause giudiziarie dipende dalla sintesi di vasti dati legali, precedenti giurisprudenziali e interpretazioni sfumate della l...
I movimenti sociali possono avere un impatto significativo sulla società, e comprendere cosa li rende di successo è fondamentale. Analizzando il messaggio e le...
Prevedere il successo di un prodotto è un compito complesso che comporta l'analisi di molti fattori, tra cui le tendenze dei social media e il comportamento dei...
Con la crescita della popolazione globale, trovare modi innovativi per produrre cibo nelle aree urbane è fondamentale. L’IA può aiutare a ottimizzare i sistemi...
Sviluppare un algoritmo equo e imparziale per la valutazione dei candidati per un posto di lavoro è un compito impegnativo. L'algoritmo deve essere in grado di...
L'attività sui social media può fornire informazioni preziose sullo stato mentale di una persona. Tuttavia, sviluppare un sistema in grado di prevedere con prec...
Creare un piano di apprendimento efficace richiede la comprensione dei punti di forza, delle debolezze e dello stile di apprendimento di uno studente. Questo co...
La parodia e la satira possono essere sottili e dipendere dal contesto, rendendo difficile determinare l'intento dietro un'opera d'arte. I sistemi di intelligen...
La diagnosi medica richiede una profonda comprensione della fisiologia umana, dei sintomi e delle opzioni di trattamento. Sebbene i sistemi di intelligenza arti...
Cosa ci vorrebbe per guidare una squadra di basket di una scuola superiore dal campo di allenamento al podio? L'AI di oggi può analizzare statistiche e proporre...
Venti bambini, un autobus, uno di loro ha appena vomitato, l'autista vuole fermarsi. Prendi la chiamata. Fai la chiamata. --- I sistemi AI attuali non sono in...
Leggi l'aria. Sappi che non è la tua conversazione. Alzati al secondo giusto. Una capacità non presente in nessun benchmark. --- I sistemi AI possono essere p...
Avvocati guadagnano le loro parcelle su questo. La clausola che sembra corretta ma in pratica significa qualcosa di diverso in questa giurisdizione con questa c...
I problemi "aha" che un tempo mettevano in difficoltà i LLM ora sono per lo più risolvibili con strumenti di chain-of-thought di qualità. --- I sistemi di int...
AlphaFold-Multimer e successori hanno superato questo benchmark nel 2024. --- I sistemi AI attuali hanno compiuto progressi significativi nella previsione del...
I modelli ML bancari fanno questo da un decennio; i moderni transformer hanno migliorato di nuovo il rilevamento dei casi limite nel 2024. --- L'IA può rileva...
GitHub Copilot Workspace, Sourcegraph Cody, altri — la maggior parte dei team di ingegneria moderni utilizza commenti di revisione generati dall'IA come prima f...
Assistenti di medicina di precisione utilizzati nei principali centri medici accademici. Le decisioni finali rimangono ai clinici; le loro suggestioni sono così...
Stato per stato, incluse le domande sui cartelli stradali e le regole di casi limite. Banale per qualsiasi moderno LLM di frontiera. --- I sistemi di intellig...
I sistemi agentici eseguono attività web multi-step, operazioni su file, chiamate ad altri agenti. Non sono ancora abbastanza affidabili per tutti i lavori, ma...
I modelli che combinano segnali social, coinvolgimento nei trailer e pattern storici ora superano i veterani del box-office nelle previsioni aggregate. --- I...
DeepMind's AlphaProof + AlphaGeometry 2 ha raggiunto un livello da medaglia d'argento all'IMO 2024 e si è avvicinato all'oro entro il 2025 in geometria e teoria...
10-Ks, chiamate sugli utili, sezioni MD&A. Gli analisti buy-side ora trascorrono più tempo a sollecitare e verificare che a leggere. --- I sistemi AI attuali...
Verbal e quantitativo entrambi. Il SAT è stato effettivamente ritirato come benchmark di progresso dell'IA — troppo facile. --- I sistemi di IA hanno dimostra...
Le quattro grandi società hanno testato in modo discreto GPT-4 contro gli esami CPA precedenti nel 2023, ottenendo punteggi sufficienti in tutte e quattro le se...
Oltre al calcolo universitario fino alla combinatoria, all'algebra astratta e all'analisi reale. Non tutta la matematica, ma gran parte di essa. --- I sistemi...
LeetCode hard, sessioni di system-design, il massimo. Il tradizionale colloquio alla lavagna è morto o in via di estinzione a causa di questo. --- I sistemi A...
Mammografia, TC polmonare, scansioni retiniche. Specialità per specialità, modelli sempre più ristretti superano il livello umano. --- Attuali ricerche sugger...
I modelli matematici specializzati e gli strumenti di reasoning in catena hanno colmato il divario con i migliori concorrenti umani nel 2024. --- I sistemi AI...
Strumenti come FunSearch e AI-co-scientist rilasciati nel 2024 hanno portato alla luce nuove ipotesi in scienze dei materiali e biologia che poi gli umani hanno...
I modelli di accompagnamento diagnostico nel 2024 hanno rilevato casi di condizioni rare sfuggite ai clinici sia nei dati di addestramento che nelle prove in te...
Già da tempo un problema difficile; per lo più risolto dai LLM contestuali del 2023. Rimangono casi limite, ma la rilevazione quotidiana è operativa. --- Attu...
AlphaZero ha imparato gli scacchi da zero in quattro ore e ha schiacciato Stockfish, il precedente re degli scacchi al computer. La fine dell'era umana contro m...
Mostrando il lavoro, non solo la risposta. Entro il 2021 i LLM lo facevano a tassi quasi perfetti su dataset standard come GSM8K. --- L'IA può risolvere probl...
Esteva et al. hanno dimostrato su Nature che una CNN poteva classificare immagini di dermatologia al livello di dermatologi certificati. --- I sistemi AI attu...
DeepMind's DeepNash ha sconfitto giocatori esperti a Stratego — un gioco con informazioni imperfette che aveva resistito ad approcci precedenti. --- I sistemi...
Gli esami a scelta multipla e a risposta libera sono saldamente nel territorio dei LLM. Ottenere 5 agli esami AP è ora un parametro di riferimento, non un tragu...
I giochi di logica LSAT, il ragionamento quantitativo GRE, formati simili — i moderni LLM si posizionano comodamente nel top decile. --- I sistemi di intellig...
GPT-4 ha superato il punteggio di superamento in tutte e tre le fasi dell’United States Medical Licensing Exam. Le facoltà di medicina ora insegnano "come usare...
Aggiungi un'affermazione all'atlante. Le revisioniamo settimanalmente.
Stiamo ancora ricercando attivamente questo tema. Imposta qui un avviso e ti faremo sapere appena ci saranno novità!
Scegli una parte, dalle un titolo di una riga, una spiegazione facoltativa e una categoria. Esaminiamo le proposte settimanalmente.