L’analisi delle migrazioni linguistiche rivela che le lingue europee, con poche eccezioni, sono strettamente collegate. Questo è evidente osservando parole fondamentali come mamma, che si ritrova con variazioni minime in quasi tutte le lingue d’Europa, così come in lingue molto distanti come lo swahili e il cinese mandarino. Roman Jakobson ha spiegato questo fenomeno attraverso lo sviluppo fonetico infantile: le sillabe ma e pa sono tra le più semplici da pronunciare, quindi i genitori finiscono per attribuire loro un significato, che si consolida nel tempo. Tuttavia, non tutte le lingue europee condividono le stesse radici linguistiche: esistono cinque eccezioni principali – basco, ungherese, finlandese, estone e turco – che appartengono a famiglie linguistiche diverse dall’indoeuropeo.
L’evoluzione delle lingue è visibile anche nei nomi dei mesi. In gran parte delle lingue europee, gennaio deriva dal latino Januarius, il mese dedicato a Giano, il dio bifronte romano degli inizi e dei passaggi. Tuttavia, esistono eccezioni come il basco urtarril, che fonde le parole urte (anno), berri (nuovo) e hil (mese), oppure il finlandese tammikuu, che si riferisce alla parte centrale dell’inverno. Anche febbraio, derivato dal latino februus (ciò che purifica), ha varianti più distanti in lingue slave e uraliche. Marzo, invece, mantiene quasi ovunque la radice latina del dio della guerra, con minime variazioni fonetiche. L’analisi etimologica mostra non solo somiglianze superficiali ma anche legami storici profondi tra le lingue, che si riflettono nel loro sviluppo nel tempo.
La linguistica storica moderna nasce nel 1786, quando William Jones, giudice britannico in India, osservò somiglianze strutturali tra sanscrito, greco antico e latino, concludendo che dovevano derivare da una lingua madre comune. Questa intuizione portò alla definizione della famiglia indoeuropea, che oggi include quasi tutte le lingue d’Europa, a eccezione delle cinque sopra menzionate, e molte lingue dell’Asia occidentale e meridionale, come il farsi, il curdo e l’hindi. La scoperta di legami tra lingue geograficamente lontane sollevò domande sulle loro origini: queste lingue derivano da una popolazione comune che si è diffusa nel tempo, o si sono influenzate a vicenda attraverso i contatti culturali e commerciali?
Charles Darwin applicò alla linguistica i principi dell’evoluzione biologica: come le specie si ramificano e divergono nel tempo, anche le lingue si modificano e si suddividono in dialetti e nuove lingue. Tuttavia, esiste una differenza fondamentale: l’ereditarietà biologica è verticale (i figli ereditano i geni dai genitori), mentre la trasmissione linguistica può essere anche orizzontale, cioè influenzata da contatti tra popolazioni diverse. Questo complica lo studio dell’evoluzione delle lingue, rendendo difficile tracciare linee genealogiche nette come si fa con il DNA.
Nel XX secolo, l’ipotesi più influente sulle origini dell’indoeuropeo fu quella dell’archeologa Marija Gimbutas. Secondo lei, la diffusione delle lingue indoeuropee avvenne attraverso le invasioni di un popolo nomade proveniente dalle steppe pontiche, tra il 4500 e il 2500 a.C. I Kurgan, un popolo di guerrieri a cavallo, avrebbero invaso l’Europa, imponendo le loro lingue alle pacifiche popolazioni neolitiche e distruggendo le loro società matriarcali. Gimbutas interpretò i reperti archeologici in chiave ideologica, vedendo nell’Europa pre-indoeuropea un’utopica civiltà pacifica, crollata sotto l’avanzata dei conquistatori delle steppe.
Negli anni ’80, Colin Renfrew propose un’ipotesi alternativa: le lingue indoeuropee si sarebbero diffuse con la migrazione degli agricoltori neolitici dall’Anatolia, circa 9000 anni fa. Secondo questo modello, la crescita demografica delle comunità agricole avrebbe gradualmente soppiantato le lingue preesistenti in Europa, senza bisogno di un’invasione violenta. Questo processo di diffusione demica spiegherebbe anche l’espansione genetica degli agricoltori anatolici, dimostrata dalle analisi del DNA.
La genetica ha contribuito a chiarire questo dibattito. Studi sul DNA antico hanno confermato che la maggior parte degli europei moderni discende sia dai primi agricoltori anatolici sia da una successiva migrazione dalle steppe, avvenuta circa 5000 anni fa. Questo suggerisce un modello ibrido: le lingue indoeuropee potrebbero essere arrivate con gli agricoltori neolitici, ma la loro diffusione potrebbe essere stata rafforzata dalle migrazioni successive.
Negli anni ’90, la linguistica adottò tecniche statistiche per analizzare l’evoluzione delle lingue. Morris Swadesh sviluppò la lessicostatistica, un metodo per misurare la distanza tra lingue contando le parole fondamentali che hanno la stessa radice. Tuttavia, il metodo si rivelò problematico perché la velocità di cambiamento linguistico varia a seconda delle circostanze storiche e culturali.
Negli anni 2000, Russell Gray e Quentin Atkinson usarono modelli computazionali della genetica evolutiva per datare l’indoeuropeo. I loro calcoli indicarono che la lingua madre comune risale a circa 8000-9000 anni fa, confermando l’ipotesi anatolica. Un’ulteriore conferma venne dall’analisi della distribuzione geografica delle lingue: utilizzando tecniche simili a quelle usate per tracciare la diffusione delle epidemie, Gray e Atkinson mostrarono che l’ipotesi anatolica era da 159 a 175 volte più probabile rispetto a quella delle steppe pontiche.
I linguisti tradizionali criticarono questi studi, sostenendo che la comparazione dei vocabolari non fosse sufficiente per determinare le parentele linguistiche profonde. Giuseppe Longobardi e Cristina Guardiano svilupparono un approccio basato sulla sintassi, analizzando la struttura delle frasi invece del lessico. Questo metodo ha mostrato che le somiglianze grammaticali possono rivelare connessioni più profonde tra le lingue di quanto non faccia il vocabolario.
L’evoluzione delle lingue è un processo complesso, influenzato sia da migrazioni demografiche sia da dinamiche culturali. L’ipotesi anatolica e quella delle steppe non si escludono a vicenda: le lingue indoeuropee potrebbero essere emerse in Anatolia con l’agricoltura e poi essersi trasformate con l’arrivo di nuove popolazioni dalle steppe. La genetica, l’archeologia e la linguistica stanno convergendo verso una visione più chiara delle origini delle lingue europee, dimostrando che la storia delle lingue non può essere separata da quella delle migrazioni umane.
* * *
Migrazioni di lingue

È quasi tutta azzurra, la mappa che vedete sopra. Basta guardarla per capire che in Europa siamo tutti parenti. Se non bastasse il dna ce lo dicono anche le lingue, con poche eccezioni, cinque in tutto. I norvegesi non capiscono il bulgaro, di solito, né gli spagnoli il lettone, ma mamma lo dicono tutti allo stesso modo. Ho scelto – devo ammetterlo – un esempio facile: mamma è la stessa parola anche in swahili e in cinese mandarino, più o meno. Uno dei più importanti linguisti del xx secolo, Roman Jakobson, ne ha proposto una spiegazione convincente. Nel primo anno di vita, nella fase in cui i bambini fanno esperimenti con i suoni, le sillabe ma e pa sono fra le più semplici da produrre. I bambini le pronunciano a caso: ma i genitori, che non lo sanno, associano a sé stessi questi suoni e ne incoraggiano l’emissione; così sono nate le parole mamma e papà. Esempio facile, dunque; ma i legami fra lingue europee saltano fuori comunque da tante altre parole, anche se per ognuna la storia è un po’ diversa. Nella mappa della parola mamma ci sono sei eccezioni. A parte l’albanese (nene), che per altri versi invece assomiglia alla maggioranza delle altre lingue, cinque le ritroveremo regolarmente in questo capitolo: il basco (ama); l’ungherese (anya); il finlandese e l’estone (rispettivamente, äiti e ema); e il turco (anne).
Ma parliamo, per esempio, dei mesi dell’anno. In quasi tutte le lingue europee, gennaio deriva da Januarius, il mese di Giano, dio bifronte romano dei ponti e degli inizi. Le eccezioni, stavolta, sono solo due: il basco urtarril, dove si fondono urte (anno), berri (nuovo), e hil (mese) e il finlandese tammikuu, che sarebbe poi il cuore, cioè il centro, dell’inverno. Febbraio rimanda al latino februus, ciò che purifica, ma stavolta ci sono più eccezioni: il ceco (únor), il croato (veljača), il polacco (luty) e l’ucraino (ljutyj), oltre che quattro di quelle che potremmo chiamare le solite cinque: basco, ungherese, finlandese e turco. Nella quinta, però, l’estone, ricompare la radice latina, veebruar, anche se la lingua estone è parente del finlandese, in cui febbraio è helmikuu (potrebbe voler dire mese di perla, forse in riferimento alla coltre nevosa). Per marzo, invece, la radice latina, dal nome del dio della guerra, si è imposta un po’ dappertutto: martxo in basco, märts in estone, március in ungherese e in turco mart, tutte con la stessa etimologia garantita da solide analisi linguistiche. Fanno eccezione il finlandese maaliskuu (il mese della terra) più, a sorpresa, il croato ožujak (mese bugiardo) e il ceco březen (corso d’acqua). E così via. Confrontare le lingue significa riconoscere non solo le somiglianze nei suoni, ma anche le relazioni etimologiche, sapendo che i meccanismi con cui cambia il nostro modo di parlare sfuggono a facili schematizzazioni. Attenzione per esempio ai falsi amici: much e mucho, in inglese e spagnolo, sono quasi identiche e hanno lo stesso significato (molto), ma hanno etimologie diverse, e quindi non sono la stessa parola.
— WILLIAM JONES E LA NASCITA DELLA LINGUISTICA. In mezzo a tante incertezze, abbiamo una sicura data di nascita della linguistica: il 1786, quando William Jones, giudice inglese della Corte Suprema del Bengala, tiene una lezione all’Asiatic Society of Bengal di Calcutta. In quell’occasione, Jones, impregnato di cultura classica e ottimo conoscitore del sanscrito, la lingua dei testi letterari e religiosi indiani fra il iv e il vi secolo, descrive le affinità del sanscrito con greco antico e latino «sia nelle radici dei verbi, sia nelle forme grammaticali, più forte di quella che si sarebbe potuta produrre per caso; così forte, di fatto, che nessun filologo potrebbe esaminare queste tre lingue senza pensare che abbiano avuto origine da una sorgente comune, che forse non esiste più». È l’atto di nascita della prima famiglia linguistica riconosciuta, l’indoeuropea. Altre famiglie, non sempre univocamente accettate dai linguisti, faranno seguito. Quante ne esistano adesso è argomento controverso: secondo alcuni esperti 12, più qualche isolato linguistico come il basco e il burushaski del Pakistan; secondo altri esperti, di più; e secondo altri esperti ancora, molte di più. Quante siano le lingue del mondo dipende da come le definiamo, tema che ci porterebbe lontano: secondo il sito Ethnologue se ne contano più di 7000.
Non è stato William Jones il primo a intuire che lingue affini derivano da antenati linguistici comuni. Ci sono ovvie somiglianze fra portoghese, spagnolo, francese e italiano, riconducibili alla comune origine dal latino. Allo stesso modo, lessico e grammatica sono simili in tedesco e olandese, due lingue che si fanno risalire a un comune antenato, il gotico. In entrambi i casi si tratta però di parentele recenti, 2000 o 1000 anni, e verificabili su testi scritti. Jones si spinge dalla storia alla preistoria, molto più indietro – anche se ai suoi tempi non si poteva dire di quanto – e postula l’esistenza di una lingua originaria non documentata da alcuna fonte, che qualche anno dopo, nel 1813, verrà battezzata proto-indoeuropeo. La proposta di legami storici fra le lingue parlate da capo Finisterre al golfo del Bengala apre prospettive nuove e solleva interrogativi. Forse tutte queste lingue discendono da quella di un popolo antico i cui attuali discendenti vivono in tutta l’Europa e mezza Asia? O c’è un’altra spiegazione possibile, magari i contatti commerciali e culturali fra popoli diversi? È la stessa alternativa che ci si è posti a proposito delle origini dell’agricoltura.
A partire dal lavoro di Jones, nel giro di qualche decennio la famiglia indoeuropea è stata definita con chiarezza. Ne fanno parte tutte le lingue d’Europa tranne cinque (le già citate basco, ungherese, finlandese, estone e turco), l’armeno e l’osseto nel Caucaso, mentre in Asia sono indoeuropee il curdo, il farsi parlato in Iran, e poi le lingue dell’Afghanistan (dari, pashtoon, tajiko), e molte di quelle del Pakistan e dell’India del nord (fra cui urdu, baluchi, punjabi, sindhi, hindi, gujarati, marathi e bengali). Altrettanto chiara non può dirsi l’interpretazione storica di queste parentele, a lungo controversa. Ma prima di arrivare alle ultime scoperte della linguistica, meglio fermarsi un momento a sentire cosa pensava Charles Darwin di tutta questa faccenda.
— COME LA VEDEVA DARWIN. L’abbiamo già detto, a Darwin non piaceva occuparsi della storia naturale della nostra specie: sapeva che quando si parla di noi stessi scattano meccanismi emotivi, irrazionali, che ostacolano una discussione sensata. In fondo, gli premeva soprattutto affermare che siamo animali, e in quanto tali non si vede perché non dovremmo esserci evoluti secondo le stesse leggi che hanno diretto l’evoluzione di tutti gli altri, punto. Però ogni tanto qualche osservazione sull’uomo gli scappava. Come le piante e gli animali, nota, anche le lingue si possono raggruppare a seconda del loro livello di parentela. Scrive a pagina 422 della prima edizione inglese dell’Origine delle specie: «Se possedessimo un perfetto pedigree dell’umanità, l’albero genealogico delle razze umane offrirebbe la migliore classificazione delle varie lingue parlate oggi in tutto il mondo; e se vi fossero comprese tutte le lingue estinte e tutti i dialetti intermedi con le loro graduali differenze, quella classificazione sarebbe, penso, l’unica possibile».
Parole chiare. Le lingue, ci dice Darwin, cambiano nel corso del tempo per effetto degli stessi meccanismi che portano al cambiamento evolutivo. Quando una popolazione resta isolata, sia le sue caratteristiche culturali sia quelle biologiche prendono la loro strada, e si evolvono in modo indipendente da quelle dei vicini. Se rappresentiamo la storia umana in forma d’albero, come una serie di ramificazioni a partire da un antenato comune, ciascun nodo dell’albero segna un momento di separazione fra due gruppi e quindi di divergenza: biologica e culturale. E quindi se disponessimo di un perfetto pedigree dell’umanità, sia le differenze culturali sia quelle biologiche rifletterebbero la serie di passaggi che hanno portato un’unica popolazione di antenati a frammentarsi in popolazioni differenti.
Molto chiaro, senz’altro; ma manca un pezzo. L’eredità biologica è verticale: i figli ereditano i geni dei genitori, e per quanto possano andare a vivere in ambienti lontani e diversi, quei geni non cambieranno nella loro vita e verranno trasmessi ai loro figli, a meno di (rare) mutazioni nel dna. Invece, la trasmissione culturale è anche orizzontale: a contatto con gente che non parla la mia lingua finirò per adottare alcuni dei loro modi di dire, espressioni che i miei genitori non adoperavano, e potrò trasmetterli ai miei figli. Dunque, Darwin propone una regola, un parallelismo fra diversità biologica e diversità linguistica, ma quella regola può avere eccezioni: bisogna verificarlo sperimentalmente, caso per caso. Ci vorrà oltre un secolo, ma alla fine è stato fatto, e oggi conosciamo, a grandi linee, pregi e limiti di questa impostazione. Ma il percorso per arrivarci è stato tortuoso, e durante il viaggio non sono mancati gli incidenti.
— MARIJA GIMBUTAS E LE ORIGINI PONTICHE DELL’INDOEUROPEO. Torniamo alle lingue indoeuropee. Per tutto il Novecento, proposte esplicite sulla loro origine vengono dagli archeologi, e molte sono legate alle idee di uno studioso tedesco, Gustaf Kossinna. La cosiddetta legge di Kossinna stabilisce che «aree archeologiche culturalmente ben definite corrispondono senza dubbio all’area in cui vivevano determinati popoli o tribù». L’idea è che si possa, anzi si debba, associare la presenza di una lingua a un tipo particolare di manufatti, spesso una tecnica di produzione della ceramica: dove ci sono quegli oggetti lì dev’esserci stata quella gente lì che parlava quella lingua lì. Nel 1902 Kossinna propone che l’antenata di tutte le lingue indoeuropee (Ursprache) abbia avuto origine in un territorio ancestrale (Urheimat) nel nord della Germania, e si sia diffusa con le migrazioni di una popolazione identificabile per un particolare tipo di ceramica, la ceramica cordata. Da lì all’idea del popolo ariano sceso dal nord a dominare mezzo mondo, il passo è breve. Se è riuscito a imporsi, questo nobile popolo sarà stato dotato di qualità superiori e dunque si meriterà di stare dove sta, più in alto degli altri.
La parola ariano viene dall’antico persiano e significa nobile; Iran ha la stessa etimologia. Gli ariani alti, biondi e con gli occhi azzurri, originari di una Urheimat di volta in volta identificata con la Germania, la Scandinavia o la Lituania, sono il prodotto di un calderone in cui evidenze archeologiche si mischiano con mitologie nordiche, spiritualità indiana e risentimento sociale. Gli ariani non sono mai esistiti se non nel genere fantasy, ma come sappiamo il loro mito ha avuto un tragico successo nel periodo fra le due guerre mondiali, e a occhio e croce sembra ancora in circolazione, in forme più o meno sfumate di suprematismo bianco. La legge di Kossinna è facile da smentire; il telefono cellulare che porto in tasca non dimostra che l’Italia è stata invasa dai coreani; ci sono relazioni fra popoli, manufatti, geni e lingue, certo, ma sono più complesse di così. Comincerà a correggere il tiro, nel 1925, un altro archeologo, Gordon Childe: ma ormai il mito ariano ha travalicato l’ambito scientifico e presto dilagherà nelle birrerie e nelle piazze di mezza Europa. Nato in Australia, fin da giovane schedato dalla polizia in quanto socialista e pacifista, professore a Edimburgo e poi allo University College di Londra, Childe ha coniato il termine rivoluzione neolitica da cui questo libro prende spunto. Come Kossinna, Childe era convinto che la diffusione di manufatti documentata dai ritrovamenti archeologici si dovesse attribuire all’effetto di migrazioni. A differenza del suo predecessore, però, Childe allarga lo sguardo: esamina quattro possibili aree d’origine dell’indoeuropeo, cioè Asia, Europa centrale, nord Europa e Russia meridionale, e alla luce delle sue vaste conoscenze archeologiche (ha viaggiato tantissimo fra scavi e musei) conclude che l’ultima, la Russia meridionale, sia la più convincente. Antidogmatico, critico anche nei confronti di sé stesso, Childe in seguito è ritornato sui suoi passi e ha spostato la possibile Urheimat in Anatolia, collocandola però in una fase successiva al neolitico.
Childe ha avuto intuizioni brillanti, per esempio che il Danubio abbia rappresentato un’importante via di diffusione del neolitico dal sudest. La sua Europa preistorica è però un mondo agitato, in continuo movimento, in cui non c’è posto per scambi culturali o commerciali. In reazione a questa visione, che qualcuno battezzerà iperdiffusionista, e certo anche ai misfatti commessi in nome della supremazia ariana, nel dopoguerra molti archeologi si spostano su posizioni antitetiche. Le innovazioni documentate dai dati archeologici vengono attribuite a sviluppi culturali locali; gli effetti delle migrazioni vengono ridimensionati, per non dire esclusi. Se Childe esagerava in un senso, qui si esagera nell’altro. Ricordo di aver chiesto a un archeologo inglese quali dati avrebbero potuto convincerlo del contrario, cioè che ogni tanto nella preistoria qualcuno migrava da qui a lì. Erano i primi anni ’90, i primi congressi in cui si incontravano, non senza difficoltà di comunicazione, genetisti e archeologi, e noi eravamo ovviamente molto affezionati al concetto di diffusione demica. La risposta era stata che per poter anche solo ipotizzare una migrazione bisognava osservare un cambiamento in qualche aspetto fondamentale della cultura: non negli utensili o nelle arti decorative ma, per esempio, nell’edilizia. Poche ore dopo, lo stesso collega presentava uno studio sul Belgio neolitico, attribuendo un cambiamento nella forma delle case a un’innovazione sviluppata dalla popolazione residente: testa, ho ragione io; croce, hai torto tu. In realtà era sbagliata la mia domanda. Il problema, e oggi forse lo ammetterebbero tutti, è che l’archeologia dimostra che in un certo momento in un certo posto si fanno certe cose, e in un altro momento altre cose. Da sola, però, non può dirci se le cose nuove le abbiano fatte i discendenti di quelli che facevano le cose vecchie, oppure gente immigrata. Ma per convincere gli archeologi, e non tutti, che anche la genetica ha qualcosa da dire sulla storia dell’umanità ci sarebbe voluto ancora qualche anno.
Malgrado tante diffidenze, la migrazione torna al centro del dibattito con una delle più influenti studiose dell’indoeuropeo, Marija Gimbutas. Lituana, trapiantata negli Stati Uniti nel dopoguerra dopo essersi rifugiata nella Germania nazista in epoca sovietica (mentre scrivo mi accorgo che molti protagonisti di questa storia sposavano posizioni politiche radicali; e non è finita) Gimbutas ha dedicato la vita allo studio di una cultura dell’est europeo chiamata Kurgan. Tecnicamente, l’abbiamo visto poco fa, i kurgan sono tumuli funerari in cui si ritrovano scheletri umani, spesso insieme ad armi e a scheletri di cavallo. Le più antiche sepolture di questo tipo, a volte alte come piccole colline, si trovano nei territori dell’attuale Ucraina, che da ora in poi chiameremo le steppe pontiche (da Ponto Eusino, il nome greco del mar Nero) e si diffondono verso l’Europa centrale nell’età del bronzo. Gimbutas ha le idee molto chiare su questa gente. Prima di loro, nell’Europa pre-indoeuropea, scrive, «non c’erano essenzialmente armi» e la vita scorreva pacifica «senza grandi cataclismi». Il periodo fra 6400 e 5200 anni fa «testimonia la dissoluzione delle vecchie civiltà europee. Tre millenni di tradizioni sono troncati da due ondate di gente Kurgan semi-nomade, arrivata a cavallo dall’est. Città e villaggi sono disintegrati, la magnifica ceramica dipinta svanisce; e così gli altari, gli affreschi, le sculture, i simboli e la scrittura. Scompare il gusto per la bellezza e la raffinatezza di stile ed esecuzione». (Mi risulta che la scrittura sia stata inventata più tardi, ma questo è quanto leggo e traduco).
Abbiamo già incontrato il popolo Kurgan: sono quelli che andavano a cavallo; in tempi recenti, verranno ribattezzati Yamnaya. Secondo Gimbutas, se si esclude l’ipotesi di una migrazione ariana dal nord, il bellicoso popolo Kurgan resterebbe il solo che può aver diffuso in tutta Europa una lingua comune. Ci sono senza dubbio evidenze di conflitti violenti nel periodo di cui Gimbutas parla. È del 2019 la scoperta di una sepoltura di massa a Koszyce, in Polonia, dove 15 persone, tutte imparentate fra loro come dimostra il dna, sono state uccise con colpi alla testa; l’età di questi resti corrisponde al periodo dell’espansione Yamnaya verso ovest. Non è chiaro però se questo stato di conflittualità abbia anche cambiato i connotati della popolazione europea. Episodi violenti possono anche derivare dall’azione di pochi individui, che lasciano sul posto pochi discendenti, o nessuno. Perché ne risenta la composizione genetica della popolazione, bisognerebbe che le scorribande armate fossero avvenute nel corso di un cospicuo movimento migratorio, simile alla diffusione demica neolitica. Il limite principale della proposta sta appunto nel fatto che, per spiegare la distribuzione delle sottofamiglie linguistiche indoeuropee, Gimbutas traccia sulla mappa una serie di frecce, ciascuna delle quali dovrebbe corrispondere a una diversa ondata migratoria. Dalle steppe pontiche giù nei Balcani e poi, lungo tre percorsi differenti, verso Albania, Grecia e Armenia; sempre dall’Ucraina, una seconda ondata migratoria che scende a sudovest attraverso i Carpazi e poi si sdoppia: in direzione dell’Italia, dove attraverso il latino darà origine alle lingue romanze, e verso le coste atlantiche, dove darà origine alle lingue celtiche; una terza ondata diretta verso ovest, le cui tre branche porteranno alle lingue slave, baltiche e germaniche; e una quarta in direzione est, verso l’Asia, che piega a sud passato il mar Caspio, per sdoppiarsi infine nei due flussi da cui si svilupperanno le lingue iraniche e indiane (queste dieci etichette si riferiscono alle dieci sottofamiglie dell’indoeuropeo). Quando con le prime analisi genetiche cominceremo a ricostruire le migrazioni preistoriche in Eurasia, molte di queste frecce non troveranno conferma. È allora che qualcuno solleva il problema: che bisogno c’è di immaginare dieci migrazioni poco o per niente dimostrate, quando sappiamo già che una grande migrazione c’è stata, la diffusione demica neolitica, e ha interessato tutta l’Europa? C’è qualche serio motivo che impedisce di datare al neolitico non solo la diffusione in Europa delle nuove tecnologie e dei geni dei primi agricoltori, ma anche delle lingue parlate negli stessi territori?
— COLIN RENFREW E LE ORIGINI ANATOLICHE DELL’INDOEUROPEO. È la proposta di un brillante archeologo inglese, Colin Renfrew, forse il primo nel suo campo a pensare che il lavoro dei biologi non andasse respinto in blocco, ma discusso criticamente. È a lui, oltre che naturalmente a Luca Cavalli-Sforza e a un altro antropologo di prima grandezza di cui presto parleremo, Robert Sokal, che si deve lo sforzo di far finalmente dialogare archeologi, genetisti e linguisti. Fra il 1991 e il 2000, prima a Firenze, poi all’Escorial, a Barcellona, a Venezia, e molte volte a Cambridge, si tengono convegni internazionali: stimolanti e burrascosi. Ma vediamo prima di tutto cosa propone Renfrew. Negli anni ’80 ci sono più dati a disposizione, e l’identificazione meccanica di una cultura materiale con un popolo e una lingua è caduta in discredito. Adesso le domande sono più articolate: non basta raccontare una storia che, bene o male, colleghi i dati linguistici a quelli archeologici; bisogna fare uno sforzo teorico, chiedersi come e perché si modifichino la cultura materiale e la lingua, e quanto i due fenomeni siano collegati fra loro. È quello che Renfrew fa: la parola-chiave, scrive, è cambiamento: in che modo cambiano nel tempo le lingue, a volte penetrando in nuovi territori, e a volte arrivando a soppiantarne altre? Elenca diversi possibili meccanismi; io qui ne citerò solo due. Da un lato, la dominanza dell’élite: un modello in cui un gruppo ai vertici della società impone la propria lingua su quelle parlate dalle classi sottoposte. È il fenomeno per cui oggi in Africa e nelle Americhe si parlano inglese, francese, portoghese e spagnolo, ma spesso le popolazioni discendono, in parte o in gran parte, da quelli che parlavano altre lingue, prima dell’arrivo degli europei. In alternativa, c’è un modello di sussistenza/demografia, in cui, disponendo di tecnologie più avanzate, una popolazione immigrante cresce fino a diventare più numerosa della popolazione preesistente, e a imporle la propria lingua. Non c’è bisogno di spiegare quanto questo modello sia debitore della diffusione demica dei genetisti.
Renfrew passa poi a chiedersi se ci sia qualche motivo serio per fissare l’origine delle lingue indoeuropee a 5000 anni fa, anziché all’epoca della diffusione demica dall’Anatolia. Si risponde di no: a che velocità si modifichi il linguaggio non lo sa nessuno, non c’è una data precisa per il proto-indoeuropeo. Quindi una migrazione delle lingue indoeuropee dall’Anatolia non solo è plausibile, ma permette anche di riconciliare le evidenze archeologiche, linguistiche e genetiche. E c’è di più. Qualche lettore ricorderà che nel capitolo 4 avevo toccato di sfuggita una questione: perché i primi agricoltori della Mezzaluna fertile sono andati a cercare fortuna proprio verso nordovest? Non potevano andare anche da un’altra parte? Nel modello di Renfrew è implicita una risposta, anche se si tratta, e Renfrew lo mette in chiaro, non di una conclusione ma di un’ipotesi da verificare. Chi è andato a nordovest poteva andare solo lì perché nelle altre direzioni avrebbe trovato altre comunità neolitiche alle prese con gli stessi problemi: popolazione in crescita, necessità di nuovi terreni coltivabili. Renfrew propone di esplorare la possibilità che dalla Mezzaluna fertile siano partiti non uno ma quattro flussi di migranti neolitici. Si rifà al lavoro di linguisti come Vladislav Illič-Svityč, Joseph Greenberg e Merritt Ruhlen, ognuno dei quali mette insieme le famiglie linguistiche in entità ancora più grandi, le superfamiglie. Secondo una di queste ipotesi, quella della superfamiglia nostratica, l’indoeuropeo avrebbe legami, sottili ma dimostrabili, con la famiglia altaica, cioè il turco, il mongolo, e altre lingue dell’Asia orientale; quella dravidica, che comprende le lingue dell’India meridionale fra cui il tamil e il telugu; e con quella afroasiatica, cioè arabo, ebraico e molte lingue berbere e del Corno d’Africa.
Quindi può darsi che i primi agricoltori neolitici si siano espansi in più direzioni: quattro flussi di migranti che hanno introdotto l’agricoltura in regioni diverse, diffondendo allo stesso tempo un insieme di lingue imparentate. Chi si è diretto verso l’Europa parlava proto-indoeuropeo; le prime comunità agricole che si sono espanse verso nordest parlavano una lingua da cui hanno avuto origine le lingue altaiche; quelli che sono andati a est erano i primi a parlare lingue dravidiche; e quelli che si sono diretti a sud i primi che parlavano lingue afroasiatiche. Nel subcontinente indiano (e, per inciso, questo è il passaggio più delicato, difficile da dimostrare) le lingue indoeuropee sarebbero arrivate più tardi, attraverso un processo di dominanza dell’élite che non avrebbe modificato nel profondo la composizione genetica della popolazione.
Da persona seria, Renfrew distingue due piani nel suo ragionamento. Sull’Eurasia occidentale e sull’indoeuropeo i dati sono abbondanti, e sono maturi i tempi per farne una sintesi che tenga conto anche delle evidenze genetiche. L’ipotesi nostratica è invece per molti un’eresia. Renfrew non prende posizione, ma scrive che vale la pena di darci un’occhiata: e ne parla con me, che all’epoca lo stavo a sentire a orecchie spalancate (per non perdermi nessun passaggio dei suoi ragionamenti) e anche a occhi spalancati, perché esploravo per la prima volta i college di Cambridge, le loro penombre, i loro divani di cuoio vecchio, i loro oscuri rituali, i giardini e i portici attraversati da studiosi di fama mondiale che a volte gesticolavano fra sé e sé. Ricordo che il Jesus College, di cui Renfrew era rettore, aveva letti scomodi, ma per secolare tradizione ci si beveva un ottimo vino di Borgogna, non disponibile nei negozi; con sublime ipocrisia anglosassone, i fellows del College si vantavano di questo e altri privilegi fingendo di non tenerci affatto.
Non solo l’accenno all’ipotesi nostratica, ma anche la proposta di un’origine anatolica delle lingue indoeuropee fa storcere il naso a molti linguisti. Nel 1988 la rivista Current Anthropology chiede a Colin Renfrew di presentarla e a una decina dei più quotati esperti di commentarla. Ne nasce uno scambio di opinioni duro e per certi aspetti feroce. La più irritata di tutti, c’era da aspettarselo, è Marija Gimbutas. Come si fa a sostenere un’origine anatolica delle lingue indoeuropee, si chiede, «quando ogni tempio e ogni santuario tombale, ogni statua e pittura murale, ogni frammento dipinto e oggetto di culto che scopriamo ci grida che questa cultura di arte, di amore per la vita, e di equilibrata coesistenza sta in opposizione a tutto ciò che conosciamo come indoeuropeo»? La proposta di Renfrew «supera ogni possibilità di critica razionale», è «pura immaginazione» e non ha alcuna base linguistica. C’è poco da fare: per capire chi ha ragione bisognerà dire due parole su come si studiano, appunto, le relazioni fra lingue.
— MORRIS SWADESH E LA LESSICOSTATISTICA. Il modo più diretto per misurare le differenze fra due lingue consiste nel confrontare i loro vocabolari. Non è l’unico, come vedremo, e richiede qualche precauzione. Per esempio, se scegliamo parole come algebra, telefono, guru o karaoke, concluderemo che tutte le lingue moderne derivano, rispettivamente, da arabo, greco, sanscrito e giapponese: non sarebbe una grande pensata. Queste parole sono entrate nell’uso comune per un fenomeno di prestito linguistico: se mi insegnano un nuovo gioco o mi offrono un frutto mai visto li chiamerò col nome con cui mi vengono presentati, anche se il nome è inglese, come poker, o wolof, come banana. È più difficile che prenda piede un modo diverso per dire io, tu, questo, tanti, mani, naso, mangiare, bere. Meglio quindi concentrarsi su pronomi personali, su certi aggettivi, su verbi che descrivono azioni abituali, su parti del corpo. Scegliendo fra queste parole i linguisti hanno concordato un dizionario di base nel quale, etimologie alla mano, si contano le parole che hanno la stessa derivazione, tecnicamente cognate, e se ne ricava una misura di affinità linguistica. Non basta la semplice somiglianza di suoni e significato (abbiamo già parlato di much e mucho), bisogna anche controllare che la radice sia comune. Pioniere di questo approccio lessicostatistico, è stato un linguista americano dalla tempestosa biografia, Morris Swadesh. Docente all’Università del Wisconsin e poi al City College di New York, impegnato a salvare quanto più possibile delle lingue indigene d’America prima che scompaiano, Swadesh viene licenziato in tronco nel 1949 in quanto comunista. Dovrà interrompere il suo lavoro per andarsene a insegnare in Canada e Messico, dove morirà giovane. Le liste standard di 100 o 200 parole usate nei confronti fra lingue si chiamano anche liste di Swadesh.
Il lavoro di Swadesh è stato molto criticato. Il problema non sta tanto nella scelta delle particolari parole comprese nelle liste, né (spero) nella sua militanza politica, quanto nella proposta di trasformare la percentuale di parole non cognate in tempi di divergenza fra lingue, a partire dall’antenato comune. L’idea è semplice, non priva di fascino, e ricalca il pensiero di Darwin. Due persone che parlano la stessa lingua usano il 100% di parole cognate. Quando dallo stesso antenato linguistico si separano due dialetti, e poi diventano lingue differenti (la distinzione fra lingua e dialetto è arbitraria), le differenze si accumulano. Per esempio, se fra italiano e spagnolo, entrambe derivate dal latino di 2000 anni fa, ci sono 20 parole non cognate su 100, cioè 20 differenze, allora altre due lingue fra cui ci sono 40 differenze discenderanno da un’antenata comune parlata 4000 anni fa. Basta contare le differenze e fare una proporzione: si chiama glottocronologia.
Swadesh costruisce la sua proposta attraverso una serie di confronti: fra inglese antico e inglese medievale, fra il latino di Plauto e il francese moderno, fra il cinese antico e il cinese mandarino. Ne conclude che ogni 1000 anni viene conservato l’86% di parole cognate, e quindi si accumula un 14% di differenze. Analisi più approfondite dimostrano però che ci sono molte eccezioni, molti fattori che possono accelerare o rallentare il cambiamento linguistico: fra i linguisti la glottocronologia cade rapidamente in discredito. La mia sensazione, da profano, è però che i confronti numerici proposti da Swadesh rappresentino comunque un passo avanti rispetto ad affermazioni per cui gli oggetti di culto ci griderebbero cosa sia indoeuropeo (sto citando Marija Gimbutas). La lessicostatistica offre una base concreta su cui ragionare: e su questa base, come vedremo, si sono fatti passi avanti.
— LA CRISI: LINGUISTI E GENETISTI NEGLI ANNI ’90. All’inizio degli anni ’90, grazie agli sforzi congiunti di alcune menti illuminate, linguisti e genetisti cominciano a parlarsi. Per un bel po’ non si capiranno. Per i linguisti, soprattutto, si tratta di superare un tabù secolare. Nel 1876, infatti, negli stessi anni in cui Darwin proponeva di studiare in parallelo lingue ed evoluzione dell’uomo, la Société de Linguistique de Paris, all’epoca la più prestigiosa associazione di categoria, proibiva ogni discussione sull’origine delle lingue, pena l’espulsione, e lo scriveva nel suo statuto. Era la reazione al proliferare di teorie più o meno cervellotiche su come e perché avessimo cominciato a parlare, tutte indimostrabili. Cent’anni dopo, non era semplice convincere i linguisti che con i nuovi dati genetici e archeologici si poteva tornare sull’argomento senza commettere sacrilegio.
Se non sbaglio, il primo convegno l’ha organizzato Alberto Piazza a Torino, nel 1989. C’era Colin Renfrew, molto impegnato a costruire ponti fra le diverse discipline; c’era Luca Cavalli-Sforza, che irradiava carisma; c’erano i linguisti, William Wang, Paolo Ramat e Merritt Ruhlen, quest’ultimo diffidente e isolato, anche a cena; e poi gli antropologi ginevrini appena tornati dall’Africa, Alicia Sanchez-Mazas e Laurent Excoffier, col loro capo André Langaney, fascinoso, provocatorio e teatrale; c’ero anch’io; e c’era Robert Sokal, il più famoso biostatistico al mondo, il fondatore della tassonomia numerica, viennese di nascita, fuggito a Shanghai sotto il nazismo, e trapiantato da decenni a Stony Brook, nello Stato di New York.
Ogni volta che ero nello stesso posto con Cavalli-Sforza e Sokal mi trovavo in imbarazzo. Era come dover dimostrare se si vuol più bene alla mamma o al papà. Difficile immaginare due scienziati più diversi fra loro. Da un lato una personalità spumeggiante, un contagioso entusiasmo, una cultura vastissima, un evidente piacere di metterla in mostra e di sedurre intellettualmente, e in più una grande capacità di tessere rapporti, capacità che è giusto definire imprenditoriale. Dall’altra un uomo schivo, controllato, scettico, il cui bisogno di emergere si esprimeva in maniera sfuggente, nel senso che bisognava conoscerlo bene, Sokal, per capire che, a modo suo, era anche vanitoso e detestava perdere. Qualcosa in comune ce l’avevano, però: erano entrambi sicuri di sé e testardi nel difendere le proprie opinioni. Ora, in quanto italiano, ma certo non solo per quello, mi sentivo legato a Cavalli-Sforza, che mi trattava con affetto e per cui provavo affetto. Da anni, però, lavoravo nel laboratorio di Sokal, che Cavalli-Sforza considerava un rivale, sentimento immagino reciproco, anche se di questi aspetti personali Sokal non parlava. In occasioni come quella sarebbe stato meglio sorvolare sui dissapori: l’obiettivo era lo stesso, entrambi erano lì per convincere i linguisti a collaborare. Macché. E io, in mezzo.
Cavalli-Sforza e Sokal erano stati i primi a prendere sul serio l’affermazione di Charles Darwin e a tradurla in progetti di ricerca. Qualche dato genetico c’era; niente a che vedere con gli archivi di adesso, giganteschi in confronto, ma ci si poteva lavorare. E c’erano dati linguistici. Cavalli-Sforza aveva adottato le 12 superfamiglie di Merritt Ruhlen (approccio inattendibile e stravagante, secondo i linguisti ortodossi), mentre Sokal classificava le popolazioni europee a seconda che parlassero la stessa lingua, o lingue della stessa famiglia, o di famiglie diverse (approccio grossolano secondo i linguisti ortodossi). Stravaganti o grossolani, questi tentativi avevano portato nel 1988 a due articoli su una prestigiosa rivista interdisciplinare, i Proceedings dell’Accademia delle Scienze degli Stati Uniti. Per anni i due hanno litigato su chi abbia rubato l’idea all’altro. Per quel che può valere, l’articolo di Sokal è uscito a marzo, quello di Cavalli-Sforza ad agosto. Ma non conta: a un certo punto certe idee sono nell’aria, sono di tutti. Niente da fare.
Sia come sia, i due articoli rispecchiano le personalità dei loro autori ed è interessante confrontarli. Quello del gruppo di Cavalli-Sforza si chiama Ricostruzione dell’evoluzione umana: portare insieme dati genetici, archeologici e linguistici. Un programma grandioso, all’epoca solo in embrione, ma presentato in modo da entusiasmare alcuni (specialmente i genetisti), irritare altri (soprattutto i linguisti) e incuriosire tutti. Da un lato, l’albero evoluzionistico delle popolazioni del mondo, costruito a partire dalle loro differenze genetiche; dall’altro, l’albero delle lingue secondo Ruhlen. I due alberi, scrive Cavalli-Sforza, sono immagini speculari: lingue e geni hanno la stessa storia. Molto più dimesso il titolo dell’articolo di Sokal: Distanze genetiche, geografiche e linguistiche in Europa. Qui l’accento non è sulla sintesi, in effetti un po’ prematura, di tutte quelle informazioni, ma sul modo per avvicinarcisi, cioè il confronto statistico. Sokal calcola correlazioni, e conclude che in Europa popolazioni che parlano lingue differenti sono geneticamente più lontane di quanto ci si aspetterebbe sulla base delle loro distanze geografiche: dunque, fattori culturali, come la presenza di confini linguistici, hanno lasciato conseguenze a livello genetico. È un po’ come la storia di lattasi e amilasi, solo che stavolta la differenza culturale sta nel linguaggio e non nella dieta.
Questi diversi stili emergevano anche nei rapporti personali. Tutti e due avevano una fitta rete di collaborazioni, ma Cavalli-Sforza andava a cercare archeologi, informatici, biologi molecolari, linguisti, fisici, zoologi: affascinandoli oppure innervosendoli. Invece Sokal attendeva che lo venissero a cercare e si muoveva con cautela; aveva meno ammiratori ma anche meno nemici. Tenersi equidistanti dai due era impossibile, anche perché facevo parte del gruppo di Sokal: e in quei congressi capitava che in cinque minuti il dissenso scientifico si trasformasse in conflitto tribale. Però ci ho provato. C’era tanto da imparare, da entrambi: uno ti incitava a buttarti, l’altro a procedere con i piedi di piombo. Su cosa fosse più importante ho cambiato idea parecchie volte, prima di arrivare alla conclusione, presumo banale, che entrambi gli insegnamenti sono preziosi. È così che bisogna fare nella ricerca: buttarsi senza timore in acque sconosciute, ma anche valutare, meglio un minuto prima di buttarsi che un minuto dopo, se si è capaci di stare a galla. A livello personale posso aggiungere che siccome io sarei uno che si butta, l’invito a procedere con prudenza mi è stato particolarmente utile.
Con qualche lodevole eccezione, i linguisti non avevano nessuna voglia di scambiare idee e dati con i genetisti. Sette di loro pubblicheranno su Current Anthropology una veemente confutazione dell’utilità degli studi interdisciplinari, intitolata Essi parlano con lingue biforcute: occupatevi dei vostri geni, per le lingue bastiamo noi. Ma nonostante le resistenze, in parte sensate, in parte no, in quegli anni prevale il desiderio di andare comunque avanti. Sokal mi chiede di provare con le simulazioni: vedi un po’ se riesci a riprodurre le differenze genetiche fra le popolazioni di lingua indoeuropea; parti da un modello semplice, passa via via a modelli più complessi, e alla fine vediamo quale funziona meglio. Mi ci metto, lo faccio. Il risultato è che senza la diffusione demica neolitica non si riescono a riprodurre i gradienti descritti da Cavalli-Sforza: c’era da aspettarselo. Meno scontata è, invece, un’altra osservazione: la semplice diffusione demica dall’Anatolia basta non solo per generare i gradienti, ma anche per spiegare le differenze genetiche fra popolazioni di lingua indoeuropea, come sosteneva Renfrew. Al contrario, se si aggiungono le migrazioni ipotizzate da Marija Gimbutas le cose peggiorano e i dati simulati si allontanano da quelli osservati. Per essere sicuro di non sbagliare, Sokal si era fatto mandare dalla Gimbutas un disegno autografo dell’area in cui secondo lei si parlava il proto-indoeuropeo, con le frecce e le date delle migrazioni. Insomma, la teoria dell’origine anatolica dell’indoeuropeo ne usciva rafforzata, anche se per dimostrarla mancava un tassello decisivo, cioè un’analisi linguistica dettagliata.
Arriverà anche quella. Nel frattempo, però, Colin Renfrew mi aveva proposto di dare un’occhiata anche all’ipotesi nostratica, secondo quanto aveva scritto nel suo articolo Prima di Babele: speculazioni sulle origini della diversità genetica. In quel titolo la parola-chiave è speculazioni. Renfrew sapeva benissimo che non c’erano ancora prove, ma per trovarle bisognava in primo luogo cercarle, anche a partire da una teoria linguistica controversa. In quel periodo lavorava con me a Padova Andrea Pilastro, che poi è diventato un importante etologo. Ci siamo rimboccati le maniche e ci siamo messi al lavoro. Se la prova della diffusione demica in Europa sta nei gradienti genetici, abbiamo pensato, allora dovremmo trovare gradienti simili anche nelle altre regioni dove si sono espansi i primi agricoltori neolitici. Queste regioni dovrebbero essere tre: il nord Africa e la penisola arabica, dove si parlano lingue afroasiatiche; la porzione dell’Asia dove si parlano lingue altaiche; e poi la regione che va dall’Iran al subcontinente indiano, nell’ipotesi che nel neolitico si siano diffuse popolazioni che parlavano lingue dravidiche, e solo più tardi, nel nord, le stesse popolazioni abbiano adottato lingue indoeuropee per dominanza dell’élite. Gradienti genetici simili non si sarebbero dovuti trovare, invece, in altre quattro regioni, le cui lingue (di famiglia austrica, caucasica, uralica e sinotibetana) non avrebbero niente a che vedere con la diffusione dell’agricoltura.

Fatti un bel po’ di conti, sembra proprio che sia così. Si trovano gradienti dove nella cartina ci sono le frecce, e non li si trova dove le frecce non ci sono, cioè nelle quattro famiglie linguistiche di confronto. Quattro processi di diffusione demica, quindi, provenienti dalla stessa regione, quella in cui è iniziata l’agricoltura, come proponeva Colin Renfrew. Ci sono, è giusto dirlo, altre possibili interpretazioni. Per esempio, si parlano lingue altaiche in un’area molto vasta, in cui i dati genetici all’epoca erano scarsi; non si può escludere che la semplice distanza geografica produca effetti facili da confondere con quelli della migrazione. Però eravamo contenti, sembrava un inizio promettente. Non lo è stato. Mentre presentavamo queste prime evidenze genetiche, i linguisti denunciavano le intrinseche fragilità dell’ipotesi nostratica. Come abbiamo visto in precedenza, la prassi ortodossa era quella di studiare le lingue a due a due. Un pioniere del nostratico, Vladislav Illič-Svityč, e quello di una teoria molto simile, Joseph Greenberg, utilizzano invece il metodo delle comparazioni multilaterali, cioè l’analisi simultanea di molte lingue. In questo modo il lavoro si riduce drasticamente. Greenberg nota che ci sono 4140 modi di suddividere otto lingue in famiglie differenti, e quindi per confrontare a due a due le migliaia di lingue del mondo ci vorrebbero milioni di studi, senza contare che con le comparazioni multilaterali le parole cognate emergerebbero più chiaramente. Il problema, però, è che in questo modo possono finire insieme lingue che hanno un certo numero di parole simili, ma etimologie e grammatiche molto diverse. Buona parte del lessico inglese, per esempio, è di origine franco-latina, ma la sua struttura no, ed è per questo che l’inglese è classificato fra le lingue germaniche. Il dibattito è ancora in corso, ma una cosa è chiara: per verificare a livello genetico ipotesi linguistiche bisogna in primo luogo che i linguisti ne siano convinti: e con il nostratico non era così. Non mi risulta che altri, in seguito, abbiano continuato per questa strada.
— RUSSELL GRAY E LA DIMOSTRAZIONE DELLA TEORIA ANATOLICA. Ma intanto la ricerca procede per altre strade. Va a due antropologi neozelandesi, Russell Gray e Quentin Atkinson, il merito di aver adattato alle esigenze dell’analisi linguistica i metodi computazionali della genetica. C’è il solito problema, le parole prese in prestito: Gray e Atkinson pensano che il loro effetto si attenui o scompaia per la cosiddetta legge dei grandi numeri, cioè se si parte da un vocabolario molto vasto. Quindi decidono di lavorare non su 100 parole, ma su quasi 2500, in 87 lingue indoeuropee. Su un campione così ampio si può anche cercare di stimare quando si parlasse la lingua da cui tutte derivano, scrivono Gray e Atkinson, avventurandosi in un campo minato, la tanto detestata glottocronologia. C’è però una novità. Il loro metodo per costruire alberi evolutivi (si chiama, per chi volesse saperlo, massima verosimiglianza o, in inglese, maximum likelihood) tiene conto della possibilità che in diversi rami i cambiamenti possano accumularsi anche a velocità diverse: non c’è più bisogno di dare per scontato che ogni 1000 anni dalla separazione ogni coppia di lingue mantenga l’86% di parole cognate, come proponeva Swadesh.
A questo punto, non resta che fare i conti: se l’Ursprache, l’antenato comune, ha 6000 anni o meno, lo si parlava nell’età del bronzo, cioè al tempo previsto dall’ipotesi pontica di Marija Gimbutas; se ha 8000 anni o più, corrisponderà alla diffusione demica dall’Anatolia, e quindi avrà ragione Colin Renfrew. Tenendo conto del possibile errore statistico, Gray e Atkinson collocano l’antenato linguistico comune alle 87 lingue indoeuropee fra 7800 e 9800 anni fa, in ottimo accordo con l’ipotesi anatolica.
I linguisti non la prendono bene, ma si trovano in difficoltà perché hanno poca dimestichezza con i numeri. Qualcuno si chiuderà in un dignitoso silenzio, ignorando questo studio; altri definiranno il metodo di Gray e Atkinson mathemagical, cioè matemagico: non capisco cosa abbiano fatto, ma non ci credo. E non è ancora finita. Dalla biologia evoluzionistica Gray e Atkinson prendono a prestito un altro metodo, quello comunemente usato per localizzare il punto da cui è partita un’epidemia: solo che stavolta lo applicano non ai diversi ceppi di virus, ma alle lingue indoeuropee. A seconda delle scelte fatte in sede di calcolo, un’origine in Anatolia risulta da 159 a 175 volte più probabile che nelle steppe pontiche.

maggiore probabilità. Le linee nere circondano le regioni delle steppe pontiche da cui avrebbero avuto origine le lingue
indoeuropee secondo l’ipotesi di Gimbutas, la linea bianca delimita la parte dell’Anatolia dove è massima la probabilità di
origine.
Bisognerà lavorarci ancora su, e comprendere meglio come si modifichino le lingue nel corso del tempo. Resta il fatto che è una differenza molto grande: chi scommetterebbe su un cavallo che ha una probabilità su 159 di vincere? Uno studio del 2023, in cui Gray e Atkinson hanno collaborato con un linguista del Max Planck di Lipsia, Paul Heggarty, confermerà che si può in effetti assegnare un ruolo alle migrazioni dalle steppe pontiche, pensando che dall’Anatolia le lingue indoeuropee si siano diffuse non solo a nordovest, sulle gambe dei primi agricoltori neolitici, ma anche verso nord, oltre il Caucaso, fino all’attuale Ucraina. Se è andata così, anche i popoli Kurgan, cioè gli Yamnaya, hanno ereditato lingue indoeuropee dai primi agricoltori, e possono aver contribuito, in un secondo momento, alla loro diffusione in Europa.
L’alternativa fra origine pontica e origine anatolica, ovviamente, è schematica. Abbiamo visto qualcosa del genere anche per l’origine dell’agricoltura in generale. Nella realtà, le grandi trasformazioni – biologiche o culturali, qui non fa differenza – non avvengono ovunque allo stesso modo e nello stesso momento. Per comprendere quale sia stato il fenomeno principale bisogna contrapporre modelli diversi, in maniera schematica, ma nella pratica devono esserci state molte sfumature. Quindi, sostenere un’origine anatolica non vuol dire pretendere che ovunque in Europa si sia cominciato a parlare una nuova lingua indoeuropea il giorno in cui il primo agricoltore ha piantato il primo seme. Per esempio, parlavano lingue non indoeuropee alcune popolazioni dell’Italia protostorica: gli etruschi, ma anche i retici, i piceni, e forse i liguri, a differenza dei loro vicini veneti, osci e umbri, oltre naturalmente ai latini. Già a metà del secolo scorso uno dei massimi glottologi italiani, Giacomo Devoto, aveva proposto il termine peri-indoeuropeo per definire territori e lingue con caratteristiche intermedie, cioè dove la transizione all’indoeuropeo sarebbe stata graduale. Rielaborando queste idee, Colin Renfrew pensa che in certi posti il cambiamento linguistico abbia richiesto tempi lunghi dopo l’inizio delle prime attività agricole. Queste sopravvivenze linguistiche pre-indoeuropee, insomma, potrebbero derivare da fenomeni simili a quelli che nella penisola iberica e in Francia hanno portato alla permanenza di un isolato linguistico non indoeuropeo, il basco.
— CONFRONTARE IL LESSICO, CONFRONTARE LA SINTASSI. Per concludere questo capitolo, una piccola anticipazione su quanto si potrà fare in futuro, e in parte stiamo già facendo. Su una cosa i linguisti hanno sempre avuto ragione: confrontare i vocabolari è il modo più diretto per farsi un’idea delle relazioni fra lingue, ma non è l’unico e ha limiti evidenti. Il numero di suoni che possiamo produrre è vasto, sì, ma non illimitato. In armeno, lingua indoeuropea, sette si dice yot, ma in yakut, una lingua altaica della Siberia orientale (chi gioca a Risiko si ricorderà della Jacuzia), si dice come da noi, sette. Non è che sotto ci stiano inauditi legami storici fra Italia e Jacuzia: è un caso. Qui allora entra in gioco la definizione di famiglia linguistica: attribuiamo due lingue alla stessa famiglia se per le loro parole possiamo rintracciare un’unica etimologia – non, dunque, italiano e yakut. In base a questa definizione, quella accettata dai linguisti ortodossi, il lessico non permette confronti fra lingue di famiglie diverse. Per analisi più ampie ci vuole qualcosa di più: bisogna allargare lo sguardo, considerare che le lingue sono più di un semplice insieme di parole; ciascuna ha una sua fonetica, cioè usa un diverso insieme di suoni, e una sua struttura grammaticale e sintattica.
Classificare le lingue sulla base dei suoni non funziona: italiano e francese sono parenti strette, entrambe indoeuropee romanze, ma il francese ha 19 suoni vocalici e l’italiano 7, cioè tanti quanti lo tswana parlato in Botswana. Molto più interessante, ma anche più complicato, è lo studio della struttura linguistica. Più complicato: per confrontare il lessico basta una lista di parole, ma per confrontare grammatica e sintassi occorre che un esperto raccolga informazioni da qualcuno che parla la sua lingua madre e le codifichi in modo da poterle confrontare. Qualche piccolo esempio. Ci sono sei modi in cui si possono mettere in fila nella frase soggetto (s), verbo (v) e complemento oggetto (o). Il più comune (45% delle lingue, fra cui giapponese, tedesco e pashtoon) è sov, e di poco meno frequente (42% delle lingue, fra cui italiano, francese, inglese e mandarino) è svo. Ma in ebraico e zapoteco l’ordine è vso, in malgascio vos, e non mancano casi di ovs e osv in alcune lingue dell’Amazzonia, come hixkaryana e warao (e, se può interessare, anche nella sintassi di mio figlio Luca, due anni: «Acqua bevo io»). Altro esempio: turco e finlandese non fanno distinzioni di genere; in altre lingue i generi sono due (spagnolo, francese, italiano, albanese…), oppure tre, compreso il neutro (tedesco, russo, polacco…); ce ne sono altre ancora (l’ojibwe, nel nord America) in cui i generi sono due, ma distinguono fra oggetti animati e inanimati. Eccetera. Da anni Giuseppe Longobardi, oggi all’Università di York, e Cristina Guardiano, all’Università di Modena e Reggio, raccolgono pazientemente queste informazioni, e molte altre, sulla struttura profonda delle lingue, convinti come sono che ci vuol poco a decidere di dire cringe invece di imbarazzante, ma è molto più difficile cambiare il modo in cui organizziamo le parole nel discorso. Dunque, somiglianze nella grammatica e sintassi possono rivelarci parentele linguistiche più profonde. Su queste basi si cominciano già a fare confronti con la genetica considerando, per la prima volta, anche lingue molto diverse.
* * *
Per saperne di più
Per un catalogo delle lingue parlate del mondo si può consultare il sito Ethnologue, dove al momento in cui scrivo ne sono elencate 7164: https://www.ethnologue.com/. Le mappe al sito https://jakubmarian.com/ permettono di farsi un’idea dei livelli di parentela e delle occasionali divergenze fra le parole usate nelle lingue europee. Ho tratto la citazione iniziale di William Jones, e moltissime altre idee e dati, dal fondamentale Archaeology and Language: The Puzzle of Indo-European Origins di Colin Renfrew (Jonathan Cape, London 1987). La recensione di questo libro, uscita nel 1988 su Current Anthropology (29: 437-468) contiene, alle pagine 453-456, l’indignata replica di Marija Gimbutas. Il testo principale di Gordon Childe, The Dawn of European Civilization, è uscito nel 1925 presso Kegan Paul, a Londra, ed è stato tradotto nel 1972 da Einaudi (Torino) con il titolo L’alba della civiltà europea.
L’articolo di Marija Gimbutas di cui ho tradotto un paragrafo è:
Gimbutas M. (1979), “The three waves of the Kurgan people into Old Europe, 4500-2500 bc”, Archives Suisses d’Anthropologie Genérale 43: 113-137.
Sulla sepoltura di massa di Koszyce:
Schroeder H., Margaryan A., Szmyt M. et al. (2019), “Unraveling ancestry, kinship, and violence in a Late Neolithic mass grave”, Proceedings of the National Academy of Science usa 116: 10705-10710.
Altri articoli fondamentali nel dibattito sull’origine delle lingue indoeuropee:
Arvidsson S. (2006), Aryan Idols: Indo-European Mythology as Ideology and Science, University of Chicago Press, Chicago.
Bateman R., Goddard I., O’Grady R. et al. (1990), “Speaking of forked tongues. The feasibility of reconciling human phylogeny and the history of language”, Current Anthropology 31: 1-24.
Renfrew C. (1989) “Models of change in language and archaeology”, Transactions of the Philological Society 87: 103-155.
Renfrew C. (1991), “Before Babel: speculations on the origins of linguistic diversity”, Cambridge Archaeoogical Journal 1: 3-23.
Renfrew C. (1993), The Roots of Ethnicity, Archaeology, Genetics, and the Origins of Europe, Unione Internazionale degli Istituti di Archeologia, Storia e Storia dell’Arte, Roma.
Sulla carriera di Sokal:
Hull D.L. (1988), Science as a Process: An Evolutionary Account of the Social and Conceptual Development of Science, University of Chicago Press, Chicago.
Sugli anni della crisi:
Barbujani G. (1991), “What do languages tell us about human microevolution?”, Trends in Ecology and Evolution 6: 151-155.
Barbujani G., Pilastro A. (1993), “Genetic evidence on origin and dispersal of human populations speaking languages of the Nostratic macrofamily”, Proceedings of the National Academy of Science usa 90: 4670-4673.
Barbujani G., Sokal R.R., Oden N.L. (1995), “Indo-European origins: A computer-simulation test of five hypotheses”, American Journal of Physical Anthropology 96: 109-132.
Cavalli-Sforza L.L., Piazza A., Menozzi P., Mountain J. (1988), “Reconstruction of human evolution: bringing together genetic, archaeological, and linguistic data”, Proceedings of the National Academy of Science usa 85: 6002-6006.
Sokal R.R. (1988), “Genetic, geographic, and linguistic distances in Europe”, Proceedings of the National Academy of Science usa 85: 1722-1726.
Weng Z., Sokal R.R. (1995), “Origins of Indo-Europeans and the spread of agriculture in Europe: Comparison of lexicostatistical and genetic evidence”, Human Biology 67: 577-594.
Sull’analisi statistica delle lingue indoeuropee e dei rapporti fra genetica e grammatica:
Bouckaert R., Lemey P., Dunn M. et al. (2012), “Mapping the origins and expansion of the Indo-European language family”, Science 337: 957-960.
Gray R.D., Atkinson Q.D. (2003), “Language-tree divergence times support the Anatolian theory of Indo-European origin”, Nature 426: 435-439.
Heggarty P., Anderson C., Scarborough M. et al. (2023), “Language trees with sampled ancestors support a hybrid model for the origin of Indo-European languages”, Science 381: eabg0818.
Santos P., González-Fortes G., Trucchi E. et al. (2020), “More rule than exception: Parallel evidence of ancient migrations in grammars and genomes of Finno-Ugric speakers”, Genes 11: 1491.