[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
l'hacker dei geni
dal manifesto di domenica 25 febbraio 2001
L'hacker dei geni
Jim Kent, il geniaccio del software per catalogare il genoma. La sconfitta
di Celera
FRANCO CARLINI
C'è un eroe nascosto (così lo ha definito il New York Times) dietro il
progetto genoma umano. Si chiama Jim Kent, è uno studente diplomato in
biologia dell'università di California a Santa Cruz, e sembra proprio che
sia stato il primo a mettere in fila i 400 mila frammenti di geni per conto
del consorzio pubblico guidato da Francis Collins, lo Human Genome Project.
Kent finì il suo lavoro il 22 giugno di un anno fa, mentre le cronache
affermano che il gruppo rivale, quello della società privata Celera
Genomics di Craig Venter, avrebbe completato l'opera solo tre giorni dopo.
Il 26 poi, con una certa enfasi, il presidente Clinton, Collins e Venter,
annunciavano al mondo che l'opera era ultimata.
C'è qualcosa di incredibile o, se si preferisce di meraviglioso, in questa
storia: il lavoro software era stato da tempo assegnato all'università dal
consorzio pubblico; si trattava di riallineare pezzi e frammenti, usando
informazioni sparse e spesso incoerenti. A differenza del gruppo privato
rivale, che fin dall'inizio aveva acquistato molti computer e enormi
memorie, il progetto pubblico non aveva grandi risorse di calcolo. Decisero
di comprare di corsa cento personal computer Pentium III e di metterli in
rete, a lavorare in parallelo. Ma non venivano a capo del software giusto
per maneggiare le informazioni. James Kent arrivò in soccorso quasi per
caso, giusto all'ultimissima ora (nel maggio dell'anno 2000): per posta
elettronica aveva sostenuto di avere un'idea semplice per realizzare quel
grande lavorio di calcolo e, disperati, gli dissero di provarci.
Curiosa anche la biografia di Kent, che ha ormai 41 anni. Già diplomato
all'università, per una decina d'anni aveva lavorato in una società di
animazioni grafiche al computer e poi era tornato a scuola, per un altro
ciclo di studi in biologia. L'esperienza di programmazione fatta nel
business senza dubbio deve essergli servita (la grafica richiede spesso
trucchi e genialità), così come il lavoro di programmazione fatto sugli
archivi di un altro genoma, quello del "verme" Caenorhabditis elegans,
anch'esso di recente ultimato. Naturalmente Kent ha una selva di capelli
irrequieti, barba e baffi neri. Sua moglie, Heidi Brumbaugh è dotata di un
suo sito personale registrato alle isole Tonga (lei scrive racconti per
bambini e fa programmazione Java) e due figli: Mira e Tisa. La più grande,
emulando i genitori, si è voluta dotare anch'essa di una Home Page
personale, la quale letteralmente rigurgita di Pokemon e animali giocosi.
A realizzare il suo programma, battezzato GigAssembler, Kent impiegò
esattamente un mese, in pratica lavorando giorno e notte, alla lettera.
Perché tanto entusiasmo? Certo per quella strana malattia dei programmatori
e degli hacker che considera una sfida ogni problema irrisolto e esercita
una sorta di desiderio di onnipotenza nel piegare le macchine di calcolo ai
propri desideri. Ma non era l'unica motivazione: "Secondo me l'Ufficio
Brevetti americano è molto irresponsabile quando permette di brevettare una
scoperta, piuttosto che una invenzione. E' davvero sgradevole". Così
volevamo ottenere un insieme pubblico di geni al più presto possibile.
Insomma, uno scopo civico e morale, un'idea alta della scienza e della
conoscenza. E anche la percezione esatta che c'era bisogno di schierarsi e
di contribuire. Potrà sembrare eccessivamente romantico a quei molti
ricercatori che la loro soddisfazione la trovano solo contemplando
l'andamento delle azioni in borsa, ma per fortuna succede ancora.
Terminato l'assemblaggio, il lavoro software non era tuttavia finito: se lo
scopo era di rendere accessibile alla comunità degli studiosi i materiali
così aggregati, occorreva che fossero leggibili, navigabili: serviva un
browser (il termine è lo stesso di quello usato per i software di
navigazione sul Web, tipo Explorer e Netscape, ma in questo caso occorreva
un prodotto specificatamente disegnato per la bisogna): grazie ad esso -
battezzato Ucsc Browser - è possibile vedere il genoma per unità
strutturali, geni e cromosomi; al di sotto di ogni traccia, la specifica
sequenza di lettere identifica le informazioni di base.
Il lavoro di Kent e degli altri biologi dell'università è online,
accessibile via Internet, fin dal 7 luglio scorso, all'indirizzo
http://genome.ucsc.edu. Chi tra i lettori lo visitasse lo troverà spartano
e semplice, ma deve servire a uno scopo e richiede qualche competenza della
materia. Il browser vero e proprio lo si vede cliccando sulla frase "Oct.
7, 2000 freeze" e poi, nella pagina successiva, sul pulsante "Submit".
Quel sito è diventato di colpo uno dei luoghi più visitati in questo ramo
della scienza. Il primo giorno, raccontano orgogliosi all'università, venne
scaricato mezzo terabyte (500 miliardi di dati) e tuttora raccoglie 20 mila
visitatori al giorno. Il capo di Kent, il dottor David Haussler, così ha
raccontato al quotidiano americano il suo successo: "Le persone ci scrivono
per ringraziarci; dicono che è fantastico che abbiamo messo tutto in rete,
senza nessun vincolo sulla proprietà intellettuale, un regalo senza alcuna
condizione".
La storia peraltro non è finita. Come è stato scritto nella puntata
precedente di questa serie, la corsa a capire davvero i geni è appena
iniziata. Ora che sono disponibili le sequenze brute di dati, del tipo
"caaaagaatg tccatggtgg tgtctggcct", si tratta di annotarle: è un lavoro
analogo a quello dei filologi, che appunto commentano con delle note le
iscrizioni e i testi di antichi linguaggi, e il software di Kent è stato
predisposto anche per questo lavoro collettivo. Tipica operazione da rete,
intesa come circuito di intelligenze tra di loro collaboranti.
Tuttavia non sarà cosa semplice. Già si affrontano infatti, due campi in
competizione e talora persino in litigio, tra i ricercatori di genetica.
Sull'un fronte ci sono i sequenziatori i quali, con tanto lavoro bruto alle
spalle, hanno reso disponibili le successioni di lettere del genoma. Ma
sull'altro fronte ci sono gli studiosi che si preparano a interpretarle,
gli annotatori, e che eventualmente potrebbero raccogliere gran parte del
merito scientifico, attraverso pubblicazioni o brevetti. La tensione è già
oggi palpabile: "operai" i primi, "intellettuali" i secondi. Gli uni
fornitori di materia prima, da cui gli altri eventualmente partiranno per
aggiungere valore conoscitivo. Nessuna meraviglia che i primi preferiscano
che le loro sequenze non circolino troppo, e magari, proprio per questo,
finiscano per appoggiare la gestione maggiormente protetta dei dati messa
in atto dalla Celera Genomics che riserva per sé il diritto di partecipare
agli utili delle medicine o terapie inventate a partire dal suo database.
Tutto ciò, a ben vedere, è tipico della Big Science, che richiede,
inevitabilmente, enormi attrezzature e squadre coordinate di decine o anche
centinaia di tecnici e ricercatori. Il tutto all'interno di una
organizzazione piuttosto ferrea e quasi industriale. E' successo a suo
tempo tra i fisici delle particelle elementari, capita ora per i biologi
molecolari, ma con una differenza. Per i primi in palio c'era solo la
gloria e la carriera, per i secondi dietro l'angolo, più che il Nobel, c'è
eventualmente il successo economico e d'impresa.