Pe lângă faptul că au o cantitate mare de date de antrenament și capacități excelente de raționament logic, instrumentele AI au și o caracteristică puternică de gândire paralelă: GPT sau alte instrumente sunt motoare de limbaj cu un vast univers de cunoștințe și pot efectua raționamente logice la viteze ultra-mari. Raționamentul oamenilor obișnuiți este: liniar, lent și necesită recuperarea memoriei. AI poate face calcule paralele pe mii de căi de inferență în același timp și apoi vă poate prezenta cele mai probabil de a fi utile. De exemplu, dacă puneți o întrebare, AI calculează instantaneu 200~2000 de răspunsuri fezabile în același timp, notează, sortează, îmbină și scoate combinația optimă. GPT spune: Puneți o întrebare și voi genera un "univers de răspunsuri candidate" și îl voi alege automat pe cel care seamănă cel mai mult cu cel pe care l-ați dori și are cel mai mult sens. (Se pare că există tendința de a vă mulțumi) În centrul GPT, atenția este o structură naturală de "gândire paralelă". Permite modelului să se concentreze pe mai multe părți ale intrării în același timp, să exploreze mai multe căi de raționament în același timp și să genereze mai multe calcule candidate în același timp, iar capetele de atenție sunt "unitățile de gândire paralele". Inferență paralelă = paralelism al capetelor de atenție + paralelism generat de arbori + paralelism al lanțurilor de inferență multi-versiune. Ele provin din: Atenție, o paralelă naturală "gândire multifocală". Beam / Tree-of-Thought Search, generarea mai multor căi de răspuns candidați. Self-Consistency & Reasoning Engine, validare încrucișată a lanțului de inferență multi-versiune, alegeți cel mai bun.