
Il nuovo modello Claude di Anthropic offre risposte sia in tempo reale che a lungo ponderate
Antropico
I modelli OpenAI o3 e DeepSeek R1 hanno una nuova concorrenza. Anthropic ha annunciato lunedì l'uscita del suo nuovo modello “hybrid reasoning”, Claude 3.7 Sonnet.
I modelli di ragionamento esistenti come o3, R1 e il pensiero flash Gemini 2.0 di Google sono progettati per suddividere problemi complessi in attività più piccole, quindi dedurre e verificare le loro risposte prima di rispondere, un processo che restituisce risposte più accurate al costo di un maggiore utilizzo di elaborazione e tempi di inferenza più lunghi. Claude 3.7 Sonnet, d'altra parte, è in grado di fornire “risposte quasi istantanee o un pensiero esteso, passo dopo passo, che viene reso visibile all'utente”, secondo il post di annuncio della società.
La doppia natura di Claude 3.7 fa parte di uno sforzo dell'azienda per semplificare l'esperienza dell'utente ed eliminare i massicci menu di selezione dei modelli presenti su altre piattaforme chatbot. OpenAI ha annunciato un piano simile con i suoi prossimi modelli GPT-4.5 e GPT-5.
"Proprio come gli esseri umani usano un singolo cervello sia per risposte rapide che per riflessioni profonde, crediamo che il ragionamento dovrebbe essere una capacità integrata di modelli di frontiera piuttosto che un modello separato interamente”, ha scritto la società. "Questo approccio unificato crea anche un'esperienza più fluida per gli utenti.”
Claude 3.7 Sonnet è disponibile per tutti gli utenti Claude, tuttavia, la capacità di pensiero estesa del modello sarà accessibile solo con un abbonamento a pagamento. Anthropic si affretta a sottolineare che anche con il suo processo di pensiero standard, Claude 3.7 supera il predecessore del modello, Claude 3.5.
Il processo di pensiero esteso del nuovo Sonetto ha dimostrato di migliorare la qualità della risposta del modello in una varietà di compiti di matematica, fisica, istruzione e codifica. ” Claude è ancora una volta il best-in-class per le attività di codifica del mondo reale, con miglioramenti significativi in aree che vanno dalla gestione di basi di codice complesse all'uso avanzato degli strumenti", si vantava l'azienda.
Anthropic ha anche preso in giro la sua IA agentic, soprannominata Claude Code, nell'annuncio di lunedì. ” Claude Code è un collaboratore attivo che può cercare e leggere codice, modificare file, scrivere ed eseguire test, commettere e inviare codice a GitHub e utilizzare strumenti da riga di comando", ha scritto la società.
Anthropic sta rilasciando Claude Code come anteprima di ricerca limitata e prevede di migliorare ulteriormente le sue prestazioni nelle prossime settimane in base al feedback degli sviluppatori e di altri early adopters. L'IA agentic si basa sul successo del precedente pseudo-agente di Anthropic, Claude Computer Use, che ha permesso all'IA di manipolare il suo sistema di calcolo locale imitando i movimenti della tastiera e del mouse di un utente umano.
Andrew Tarantola è un giornalista con più di un decennio di rapporti sulle tecnologie emergenti che vanno dalla robotica e macchina…
M4 MacBook Air prestazioni quasi compete con i modelli Pro
Il MacBook Air M4 è previsto come il prossimo laptop leggero e veloce di Apple, e un recente benchmark suggerisce che il dispositivo potrebbe avere lievi miglioramenti delle prestazioni rispetto all'ultimo MacBook Pro.
Apple dovrebbe annunciare il prossimo laptop nei modelli da 13 pollici e 15 pollici nel periodo di marzo. Un dispositivo sospettato di essere il MacBook Air M4 è emerso sul benchmark Geekbench 6 il 19 febbraio, rivelando risultati che gli esperti stanno confrontando con altri prodotti Apple, tra cui il MacBook Pro M4 e l'iPad Pro M4 da 13 pollici.
Leggi di più
Gli utenti potranno infatti controllare Instagram e Facebook. Speriamo solo che funzioni
Un mese fa, Meta ha detto che stava terminando il suo programma di fact-checking di terze parti e ha detto che avrebbe fatto affidamento sugli utenti per segnalare la disinformazione. Oggi, la società ha annunciato Community Notes, che adotta un approccio simile a X, e sarà implementato su Facebook, Instagram e Thread.
I requisiti per essere uno scrittore di note della comunità è che si deve essere un cittadino degli Stati Uniti oltre 18 anni di età, avere un numero di telefono verificato, e un account che è più vecchio di 6 mesi. Non tutte le note della comunità saranno pubblicate però, in quanto ciò richiederebbe un consenso di sorta tra gli altri contributori.
Leggi di più
Sfrutta il Copilot di Microsoft con questo Surface Pro 11 in vendita
Se vuoi un dispositivo che massimizzi Copilot, il potente assistente AI di Microsoft, avrebbe senso optare per Microsoft Surface Pro 11. E se lo acquisti oggi, puoi approfittare dell'offerta di Best Buy di uno sconto di $350 per un pacchetto che raggruppa il laptop 2-in-1 con la tastiera Surface Pro. Invece di $1.350, dovrai pagare solo $1.000, che in realtà è un prezzo abbastanza buono per una macchina di questo calibro. Non è un buon momento per esitare con il tuo acquisto, poiché i risparmi potrebbero scomparire non appena domani.
Perché acquistare Microsoft Surface Pro 11
Non è una sorpresa che il Microsoft Surface Pro 11, che è descritto nella nostra carrellata dei migliori laptop 2-in-1, sia un laptop Copilot+. Promette tempi di risposta più rapidi e una maggiore sicurezza per Copilot di Microsoft, per un'esperienza ancora migliore quando si utilizzano funzionalità come il richiamo per trovare istantaneamente documenti o pagine Web o la generazione e la modifica di immagini. Il dispositivo è dotato di componenti che forniranno la potenza di cui Copilot ha bisogno-viene fornito con il processore Qualcomm Snapdragon X Plus e la GPU Qualcomm Adreno, oltre a 16GB di RAM che è al livello delle macchine di alto livello, secondo la nostra guida su quanta RAM hai bisogno.
Leggi di più





Altri articoli






Il nuovo modello Claude di Anthropic offre risposte sia in tempo reale che a lungo ponderate
Anthropic ha annunciato il rilascio della sua ultima iterazione del suo Claude AI, uno che può fornire risposte sia in tempo reale che a lungo ponderate alle query degli utenti.