Tito ORLANDI

               SULLA CODIFICA DELLE FONTI ARCHEOLOGICHE



     1. La prospettiva informatico-metodologica

     Il valore di questo contributo e delle osservazioni che ver-
     ranno esposte è fortemente legato al riconoscimento  di  una
     disciplina  che  si occupi non delle singole concrete appli-
     cazioni dell'informatica nei differenti settori degli  studi
     umanistici,  ma  dei problemi che tali applicazioni hanno in
     comune. In altri termini, si accetta la possibilità  che  di
     tali  problemi si occupi non uno specialista di informatica,
     e nemmeno uno specialista di un singolo  settore  umanistico
     con  competenze  informatiche, ma uno studioso di estrazione
     umanistica che prenda in considerazione quanto vi è  di  co-
     mune  fra  le  metodologie dei singoli settori, dal punto di
     vista delle applicazioni dell'informatica.

     Questo può lasciare inizialmente perplessi, perché posizioni
     di questo tipo nascondono spesso vaghe e poco utili general-
     izzazioni. Ritengo tuttavia che vi sia più di un motivo  per
     accettare  l'ipotesi  proposta.  La breve storia dell'infor-
     matica umanistica è costruita in larga  parte  di  scambi  e
     rapporti  fra  studiosi  e tecnici di specializzazioni anche
     molto lontane, che devono capire i reciproci fondamenti.  Un
     filologo  non sarà più lontano dall'archeologia di un matem-
     atico o di uno statistico o di un ingegnere elettronico;  e,
     se  ha riflettuto sulle caratteristiche generali dell'infor-
     matica, può avere qualche buona idea anche su discipline  di
     non diretta competenza.

     Ad ogni modo il mio inserimento nel dibattito di questo con-
     vegno può essere pienamente giustificato soltanto se si  ac-
     cetta   che  le  applicazioni  umanistiche  dell'informatica
     finiscano per determinare una sfera di interessi comuni, che
     produce  una comune metodologia; e dunque che la metodologia
     dell'informatica umanistica si intrecci con  le  metodologie
     specifiche delle singole discipline. A sua volta questo pre-
     suppone che si accetti che l'informatica non  sia  semplice-
     mente un insieme di tecnologie, ma una serie di metodologie,
     e dunque una disciplina con un proprio  fondamento  teorico,
     che deve in qualche modo interagire con quello proprio delle
     singole discipline umanistiche.

     Cercherò di darne un esempio, prendendo in considerazione  i
     problemi  della  codifica della documentazione archeologica,
     non senza aver aggiunto che molto di  quanto  dirò  dovrebbe
     valere,  con  i dovuti aggiustamenti, anche per altre disci-
     pline.  E' necessario  tuttavia  impostare  il  ragionamento
     partendo  dai  fondamenti  dell'archeologia,  per  vedere in
     quali settori e in quale modo  le  metodologie  informatiche
     possano efficacemente integrarsi in tale disciplina.  Fortu-



                       Archeologia e calcolatori                1







     natamente, pubblicazioni recenti (unite alla personale  fre-
     quentazione  con  colleghi  archeologi) hanno reso possibile
     questa operazione. Mi riferisco soprattutto al volume stori-
     co-metodologico  di  Bruce G. Trigger, a quello metodologico
     fondamentale di Jean-Claude Gardin, a quello specifico di F.
     Djindjian; e naturalmente alle prime annate di Archeologia e
     Calcolatori, che sono  ricche  di  contributi  metodologici.
     (Nota 1)

     Se si considera il lavoro dell'archeologo dal punto di vista
     dell'informatica, non mutano ovviamente i  fondamenti  della
     disciplina,  ma  muta  la  prospettiva.  Ora, secondo questa
     prospettiva, si può sintetizzare il  lavoro  dell'archeologo
     come classificazione, valutazione e spiegazione dei documen-
     ti che egli seleziona in quanto utili ai fini della  propria
     ricerca.   Detto  in  termini più informatici, l'archeologia
     sottopone a procedimenti analitici e sintetici i dati desun-
     ti  dall'informazione  di  carattere appunto "archeologico",
     cioè quella che proviene da artefatti e non da  manoscritti.
     (Nota 2)

     2. La codifica in archeologia

     L'attenzione  degli studiosi interessati alla metodologia si
     concentra soprattutto sul trattamento dei dati, e sulla con-
     seguente formalizzazione del ragionamento archeologico. Meno
     sul passaggio iniziale di definizione e descrizione, o rapp-
     resentazione,  dei  dati, cioè quello che intendiamo appunto
     per codifica, e che viene in certo modo  ritenuto  ovvio,  e
     quasi banale.  Si nota p.es. che nella storia dell'archeolo-
     gia lo spazio dato al metodo di descrizione degli oggetti  è
     quasi  nullo rispetto a quello dato ai vari metodi di inter-
     pretazione. (Nota 3)

     Fra coloro che dedicano attenzione al problema della codifi-
     ca  sono  Gardin e Djindjian. Il primo (che fa della rappre-
     sentazione, o "compilation", a uno dei  due  momenti  essen-
     ziali  dell'attività  archeologica)  sottolinea come non sia
     sufficiente una riproduzione che diremmo di tipo  analogico,
     ma  sia  necessaria per la scienza una rappresentazione sim-
     bolica mediante un linguaggio.  Egli discute a  lungo  quale
     tipo  di  linguaggio debba essere utilizzato a questo scopo.
     (Nota 4)

     Djindjian ritiene riduttivo questo punto  di  vista,  valido
     cioè  soprattutto  nella  prospettiva della realizzazione di
     banche dati, e propone invece come  codifica  la  scelta  di
     quelle caratteristiche che consentano un determinato tipo di
     analisi: preferibilmente quantitativa, ma eventualmente  an-
     che morfologica, seriale, etc. (Nota 5)

     Da parte nostra, pensiamo che una riflessione sulla codifica
     vada fatta partendo da presupposti più generali, non solo di
     ambito archeologico, ma genericamente informatico.




                       Archeologia e calcolatori                2







     Diremo intanto che per l'informatica intesa come tecnologia,
     (Nota 6) (che pure è fondamentale, perché i procedimenti in-
     formatici  sono  oggi presi in considerazioni in quanto con-
     sentono l'uso dei computer per aiutare lo studioso in alcuni
     importanti  momenti  della sua ricerca) la codifica è un mo-
     mento necessario per poter "scrivere"  i  dati  su  supporto
     magnetico, e quindi gestirli per mezzo dei computer. Il com-
     puter diventerà il principale veicolo di  diffusione  scien-
     tifica,  e il principale ausilio nel lavoro quotidiano dello
     studioso. Dunque non se ne può prescindere.

     In questo senso la  codifica  consiste  semplicemente  nella
     possibilità di trasferire all'interno di una memoria magnet-
     ica i dati da sottoporre agli appositi programmi di un  com-
     puter,  così  come  sono  già preparati sulla carta.  Questo
     passaggio (che propriamente noi chiameremmo di "transcodifi-
     ca",  cioè  di puro passaggio da un codice all'altro) si ri-
     solve semplicemente nell'uso corretto  della  tastiera,  che
     oggi  è  lo  strumento naturale per l'input dei dati.
     Anche questo semplice passaggio non è  esente  da  problemi,
     perché  vi  sono  molti  tipi di tastiera, che offrono molti
     tipi di corrispondenza fra i simboli riportati sui  tasti  e
     le  sequenze  magnetiche  (o sequenze di bit) prodotte nella
     memoria del computer. Ma non è di questi problemi che inten-
     diamo trattare in questa sede.

     Prima  ancora esiste un problema teorico della codifica, che
     è sempre stato conosciuto, ma di solito è  stato  trascurato
     perché  risolto  alla buona, in quanto precentemente il mes-
     saggio archeologico era rivolto sempre a intelligenze umane,
     che  compivano  implicitamente  grossi passaggi di interpre-
     tazione. Con il supporto  cartaceo  questo  era  consentito,
     perché i dati su carta possono essere letti solo da intelli-
     genze umane, che compiono su di essi  una  serie  di  elabo-
     razioni  ovvie, e inconsce, prima di entrare nel merito sci-
     entifico. I dati su supporto magnetico vengono invece  anal-
     izzati  da  un  computer,  che non andrà mai oltre ciò che è
     perfettamente esplicito nei dati stessi.

     Si può dire che, come si può benissimo usare una lingua sen-
     za  esplicitarne le regole grammaticali, ma se si vuole sta-
     bilire la correttezza di un testo che si  pretende  espresso
     in  quella lingua, bisognerà chiarirne la struttura; così si
     può usare efficacemente della codifica,  senza  teorizzarla,
     solo  finché non sorga la necessità di discutere se un certo
     lavoro di codifica sia stato fatto correttamente o no.

     3. Definizione della codifica

     Definiremo dunque in senso tecnico la codifica come il  pro-
     cedimento  per mezzo del quale i dati che compongono una in-
     formazione vengono espressi mediante un codice (possiamo an-
     che  chiamarlo alfabeto) in modo da poter costituire un mes-
     saggio, cioè da poter essere trasmessi fra soggetti, che non
     sono necessariamente persone umane. (Nota 7)



                       Archeologia e calcolatori                3







     Si  comprende  subito che, definita in questo modo così gen-
     erale, la codifica da un lato presuppone un  accordo  almeno
     di massima su concetti niente affatto semplici o banali: in-
     formazione, messaggio, codice, trasmissione, etc.;  dall'al-
     tro  una  serie di operazioni all'apparenza intuitive, ma in
     realtà assai problematiche: scelta del codice, verifica del-
     la  sua  correttezza,  dichiarazione  della correlazione fra
     codice e dati; effettuazione operativa della codifica,  etc.

     Per quanto riguarda il primo punto, una riflessione sui con-
     cetti che entrano in gioco in una teoria della  codifica  ci
     porta direttamente al settore studiato dalla semiotica, dis-
     ciplina se si vuole controversa per aver in qualche caso da-
     to  luogo  a  tediose  e  apparentemente  inconcludenti elu-
     cubrazioni, ma i cui problemi non si possono trascurare, so-
     prattutto nell'ambito di una attività il cui compito è quel-
     lo di trattare informazione.  Ad  ogni  modo,  non  possiamo
     farne qui più di un accenno.  (Nota 8)

     Il secondo punto, quello operativo, riguarda invece da vici-
     no il nostro tema, e su questo intendiamo proporre una serie
     di  considerazioni.  Una  prima, di carattere preliminare, è
     che in  questo  modo  il  procedimento  della  codifica  non
     riguarda  solo  un  trasferimento  di  segni, cioè l'utiliz-
     zazione di un codice al posto di un altro (su ciò cf. sotto:
     vari  tipi  di operazioni di codifica...), ma anche la valu-
     tazione dei dati che si intendono codificare.  Infatti,  per
     verificare  la  validità e la congruità di una codifica, oc-
     correrà avere un'idea ben precisa non solo  del  codice,  ma
     anche  dei  dati; e occorrerà che questi dati siano analizz-
     abili come unità ben specificate.

     4. Dal continuo al discreto

     La codifica presuppone l'individuazione consapevole e  medi-
     tata  di elementi discreti in un universo continuo, quale si
     può definire l'oggetto di uno studio.  Questo  modo  di  es-
     primersi  è tipicamente informatico (dell'informatica teori-
     ca), ma il procedimento è  ben  presente  nelle  riflessioni
     storiche e metodologiche sull'archeologia, anche se i diver-
     si autori lo definiscono in modo più convenzionale. Così  lo
     storico  dell'archeologia  (Nota  9)  nota come l'evoluzione
     scientifica dell'archeologia  (culture-historical  approach,
     opposto  all'antiquaria e all'evoluzionismo) porta come con-
     seguenza anche  una  maggiore  attenzione  alla  definizione
     degli ambienti da cui provengono i reperti, e alla consider-
     azione di tutti i reperti, non soltanto di alcuni.

     A sua volta, Albert Spaulding nota che il concetto di  manu-
     fatto  "fornisce  la  classe  di entità con cui si confronta
     l'archeologia, gli oggetti o i resti di oggetti che mostrano
     gli  attributi  di una attività socialmente orientata. (...)
     La possibilità di riconoscere i manufatti implica la  capac-
     ità  di riconoscere quegli attributi dei manufatti che rapp-
     resentano una modificazione  umana  coerente,  cosicché  noi



                       Archeologia e calcolatori                4







     siamo  condotti  ad  una  categoria  fondamentale, l'insieme
     degli attributi culturalmente significativi, riuniti insieme
     dal loro esistere in un singolo oggetto". (Nota 10)

     Il teorico Djindjian si sofferma a più riprese sul carattere
     anche di scelta che deve avere l'operazione di  codifica,  e
     in  particolare nota che "E' indispensabile sottolineare che
     le descrizioni libere di un reperto rendono inefficace  ogni
     tentativo  di  costruzione  tipologica.  La  ricerca  di una
     ipotetica esaustività della descrizione, ottenuta  moltipli-
     cando  le  variabili  descrittive, è un'illusione pericolosa
     che occorre denunciare energicamente.  Ne  risulta  general-
     mente  una  classificazione  in cui l'aggiunta o la soppres-
     sione di una variabile può modificare le  classi,  impedendo
     ogni  validità  del  risultato  e ogni interpretazione delle
     classi."  (Nota 11)

     Questo vale però per il rapporto immediato fra la codifica e
     la  sua  utilizzazione, non per il problema in sé della cor-
     rettezza della codifica.

     Da parte sua Gardin afferma: "Ciò che distingue una  'compi-
     lation'  scientifica  dalla  prosa di un collezionista è che
     essa fa uso di un linguaggio rappresentativo che si  suppone
     superiore,  sia  teorieticamente  per  l'accumulazione della
     conoscenza scientifica, sia praticamente,  per  la  gestione
     dell'informazione.  (...)  Una  pura collezione di oggetti o
     riproduzioni (foto, disegni, etc.) non costituisce una 'com-
     pilation' scientifica". (Nota 12)

     5. La perdita d'informazione

     Non c'è dubbio, ad ogni modo, che nel passaggio dal continuo
     della realtà al discreto della codifica, intendendo per tale
     la  prima presa di contatto dello studioso con la realtà che
     diventa oggetto del suo studio, si verifica  necessariamente
     una perdita di informazione nei riguardi del messaggio orig-
     inale.  Questa perdita di informazione dovrà da un lato  es-
     sere  contenuta nel minimo indispensabile; ma dall'altro es-
     sere attuata tenendo conto dei fini per cui si agisce.

     C'è innanzi tutto un fine immediato, cioè un'analisi  o  una
     serie  di  analisi che si sono giè progettate nel momento in
     cui si codifica il materiale studiato. (Nota 13) C'è d'altra
     parte  la necessità che sia possibile sfruttare il materiale
     codificato per altre analisi da parte anche  di  altri  stu-
     diosi. Per questo mi sembra che sia più corretto, in termini
     di generale metodo informatico, tendere fin  dall'inizio  ad
     una  completezza intrinseca della codifica, considerando gli
     oggetti per se stessi, e non solo nel contesto di una speci-
     fica ricerca; nemmeno della differenza, che pure sembra così
     originaria, fra gli aspetti da codificare in vista  dell'in-
     serzione  in una banca dati, e quelli in vista di un'analisi
     quantitativa.




                       Archeologia e calcolatori                5







     6. Vari tipi di codifica

     Normalmente si considera banale la codifica, perché si pensa
     ad  una operazione puramente macchinistica, cioè che presup-
     pone già un'informazione codificata  (generalmente  in  lin-
     guaggio  naturale,  talora in linguaggio tecnico formalizza-
     to), e che quindi consista semplicemente nella trasposizione
     in  un codice memorizzabile.  In un primo tempo per codifica
     si intendeva addirittura un procedimento di  semplificazione
     del documento, in modo da estrarne solo alcuni elementi fon-
     damentali, che potessero essere  memorizzati  sfruttando  il
     minimo  spazio  di supporto magnetico possibile.  Questa vi-
     sione è stata superata da tempo a causa del progresso  negli
     apparati di memorizzazione. (Nota 14)

     Ma  ancora  usuale è purtroppo il punto di vista di chi con-
     sidera la codifica come il puro passaggio da una  situazione
     descrittiva  adatta al veicolo cartaceo (in sostanza il lin-
     guaggio naturale) al suo corrispondente in  codice  binario,
     adatto al supporto magnetico. Si dimentica che in tal caso i
     procedimenti automatici riguarderanno non il materiale docu-
     mentario  in  sè, ma la sua descrizione; e non si sottoporrà
     tale descrizione alla necessaria critica analitica, che con-
     senta  di  evitare errori e confusioni nella valutazione fi-
     nale dei risultati del procedimento automatico.

     Scrive a questo proposito José E. Igartua: "A questo livello
     la codifica significa definire il significato delle parole e
     numeri che si inseriscono nel computer, in modo che  la  ma-
     nipolazione  dei  simboli operata dalla macchina corrisponda
     ad una manipolazione dell'informazione che  sia  utile  allo
     storico.   Incoerenze  e  ambiguità che rimangano dopo che i
     dati sono stati resi "machine-readable" inficierà  l'analisi
     successiva e sarà difficile da rimediare". (Nota 15)

     Inoltre non si tiene conto del fatto che non c'è un rapporto
     di necessità e dipendenza fra quello che  possiamo  memoriz-
     zare su supporto magnetico, per poi sottoporre a procedimen-
     to automatico, e quello che è rappresentato  sulla  tastiera
     per  mezzo della quale vengono compiute le operazioni di in-
     put (lettere,  numeri,  parentesi,  etc.).   Il  valore  at-
     tribuito  alle  sequenze  di bit che vengono memorizzate può
     anche non coincidere con quello previsto  dalle  convenzioni
     normalmente  utilizzate  (p.es. il codice ASCII), anche se è
     più comodo  accedere  ai  modelli  di  codice  previsti  dai
     costruttori   delle  macchine.  Tali  modelli  sono  lontani
     dall'essere completi, e comunque non sono aderenti alle esi-
     genze della ricerca umanistica, in particolare archeologica.
     In realtà, salvo il fatto che i dati devono essere discreti,
     la  loro  scelta  e la scelta di come rappresentarli dipende
     esclusivamente dallo studioso.

     C'è inoltre una possibile confusione fra  il  momento  della
     scelta di un codice e quello della individuazione della cor-
     rispondenza biunivoca fra i simboli ottenuti con  il  codice



                       Archeologia e calcolatori                6







     scelto e gli elementi della realtà che vengono rappresentati
     da quei simboli. Ci sono da un lato vari passaggi, per mezzo
     dei  quali  l'alfabeto  dà  origine  a  unità più complesse;
     dall'altro decisioni soggettive, mediante le quali si  attua
     la  corrispondenza fra gli elementi da codificare e le unità
     complesse.  (Nota 16)

     Inoltre tutto questo va  visto  in  rapporto  ai  differenti
     piani  di  rappresentazione  della realtà.  Infatti i
     procedimenti informatici possono essere applicati  alla  re-
     altà,  come si presenta direttamente allo studioso; ovvero a
     rappresentazioni di tale realtà. Sarà perciò possibile  dis-
     tinguere:

     1. Rappresentazione diretta: è quella che avviene me-
     diante immagini assunte come tali (fotografia, riprese tele-
     visive,  disegni, etc.)  ovvero mediante banche dati formate
     per mezzo di inchieste dirette, cioè con questionari  a  cui
     rispondono  i  diretti interessati.  La rappresentazione per
     immagini è naturalmente usata pesantemente in archeologia, e
     sarà opportuno citare il progetto ARCOS, perché frutto anche
     di una riflessione approfondita  sui  risvolti  in  fase  di
     ricerca. (Nota 17)

     2. Rappresentazione indiretta: in questo caso il pun-
     to di partenza è rappresentato da documenti  scritti  (anche
     letterari),  i quali vengono codificati. La corrispondenza è
     dunque col documento, non con la  realtà  rappresentata  dal
     documento. Questo significa che nel valutare i risultati dei
     procedimenti informatici occorrerà tener conto sia  dell'in-
     terpretazione  di  chi ha redatto i documenti, sia di chi li
     codifica.

     3. Rappresentazione doppiamente indiretta: quando  il
     documento  su cui si lavora è un'opera storiografica, da cui
     si ricavano notizie da codificare, si opera una prima sinte-
     si  o  scelta  degli  argomenti, oltre a codificare e inter-
     pretare il documento.

     Per l'archeologia è  opportuno  introdurre  una  dis-
     tinzione  ulteriore,  che riguarda la volontarietà e la con-
     sapevolezza del messaggio. Posto  che  con  la  codifica  si
     perde  sicuramente  una parte dell'informazione contenuta in
     un messaggio (o comunque nella "cosa" che prendiamo in  con-
     siderazione  come  trasmettitrice di un messaggio) mi sembra
     che uno dei criteri, forse il  principale,  per  cercare  di
     ridurre  al  minimo quella perdita, sia quello dell'aderenza
     alla volontà della sorgente del messaggio.

     A questo punto, l'archeologia si trova di fronte a due  pos-
     sibilità  che  devono  essere  distinte. Da un lato, è p.es.
     possibile immaginare che chi ha costruito un edificio  sacro
     abbia avuto effettivamente intenzione di trasmettere messag-
     gi che riguardassero la sua concezione della religione o an-
     che una sua concezione estetica; d'altro lato chi ha fabbri-



                       Archeologia e calcolatori                7







     cato un certo tipo di ceramica non ha sicuramente avuto  in-
     tenzione di farci conoscere il tipo di società che essa pre-
     suppone. (Nota 18)

     7. La codifica all'interno del processo archeologico

     La codifica è, per un verso, il momento iniziale di un  pro-
     cedimento di ricerca, in particolare quello attuato mediante
     metodi anche informatici. Ma, sotto un altro aspetto,  rapp-
     resenta anche (e forse principalmente) il momento conclusivo
     di un procedimento precedente, che ha condotto  ad  individ-
     uare:  i  confini  del  materiale  documentario che si vuole
     prendere in considerazione; le caratteristiche di quel mate-
     riale  che  determinano  il suo interesse per la ricerca; la
     scelta di un linguaggio per esprimere i due punti  preceden-
     ti;  il  modo  di  esprimere  in tale linguaggio l'identifi-
     cazione del materiale documentario e le sue caratteristiche.

     Risulta  da questo che una codifica non sarà mai definitiva,
     perché i risultati del procedimento di ricerca che  ha  dato
     origine  alla  codifica  è prevedibile che siano tali da far
     mutare almeno in parte la codifica, o almeno a rendere  nec-
     essaria  la  codifica  di  ulteriori documenti o caratteris-
     tiche. (Nota 19)

     Dunque la struttura della codifica deve  essere  aperta,  in
     modo  che  si  possa intervenire apportando aggiunte o modi-
     fiche.  In questo senso la codifica comprende anche l'aspet-
     to  di  struttura dei dati, non solo quello della loro indi-
     viduazione in quanto oggetti  singoli;  e  sembra  opportuno
     vederla  come  una  struttura relazionale.  La struttura re-
     lazionale dei dati è da un lato un modo  più  funzionale  di
     gestire una banca dati; ma per quanto ci riguarda qui, essa,
     vista da chi la disegna nella fattispecie singola, è un  al-
     tro dei modi di intendere la codifica.

     Il sistema relazionale è il migliore, perché la realtà è più
     vicina ad una struttura relazionale che non ad una struttura
     gerarchica.  La  struttura  dunque  di  una  banca  dati re-
     lazionale riprodurrà  in  modo  più  fedele  ciascuno  degli
     oggetti  della  ricerca, anche perché ne manterrà i rapporti
     con gli altri oggetti su un piano parallelo,  e  non  verti-
     cale,  così  come  nella  realtà vi sono piuttosto relazioni
     multiple sullo stesso piano che relazioni di  dipendenza  di
     un oggetto da un altro.

     D'altra  parte  c'è  sempre  un  momento di crisi nella con-
     cezione di una struttura relazionale, ed è la scelta di  ciò
     che si considera soggetto, e di ciò che si considera attrib-
     uto. A meno che non si facciano tabelle di  due  soli  campi
     (identificativo  e  soggetto),  quelli che per certi fini di
     studio sono considerati attributi per  altri  fini  andranno
     considerati soggetti.

     Intendendo   tuttavia   il   sistema  relazionale  come  una



                       Archeologia e calcolatori                8







     costruzione teorica, è lecito chiedersi se le  realizzazioni
     informatiche  che  ne  vengono  date rappresentino una situ-
     azione ottimale nella prassi. Si può allora dire che  è  in-
     dubbiamente  vero  che il sistema relazionale rappresenta un
     progresso radicale rispetto agli altri  sistemi  precedente-
     mente immaginati; ma che in ambito umanistico, e in partico-
     lare archeologico e storico, si fa strada la convinzione che
     esso possa rimanere sullo sfondo come organizzazione mentale
     dello studioso, da attuare al momento in cui serve,  ed  es-
     sere sostituito a livello di codifica da una procedura anco-
     ra più libera e aderente alla realtà come si  presenta  allo
     studioso.  (Nota 20)

     Tale procedura si articola in due momenti fondamentali:

     (1) Codifica rappresentativa al massimo del documento.
         La codifica non è basata su ciò che sembri utile
         estrarre dal documento (questo si farà poi tramite
         i Tag), ma solo sulle caratteristiche intrinseche
         del documento, cioè sul messaggio "autentico" che
         chi ha prodotto il documento voleva trasmettere.
         Essa è attuata mediante file del tutto liberi, nei
         quali la struttura è determinata "a posteriori"
         da annotazioni (Tag) inserite diciamo così fuori
         testo, come un meta-linguaggio descrittivo.

     (2) Trattamento del documento in modo da estrarre come
         "secondo passaggio" le notizie utili per lo
         studioso, nella particolare indagine che sta
         conducendo.

     La  codifica  riveste dunque un'importanza assai maggiore di
     quella che di solito le si concede.  C'è addirittura la pos-
     sibilità  (che riteniamo da evitare) che essa diventi total-
     izzante, cioè che riunisca in sé anche  gli  altri  passaggi
     del  trattamento  automatico  (l'analisi dei rapporti logici
     fra i dati, e la verifica della  correttezza  teorica  delle
     procedure di analisi e di sintesi).

     In  effetti occorre sempre considerare con attenzione l'ele-
     mento di petitio  principii  insito  nella  codifica,
     cioè quel fenomeno per cui un certo materiale, codificato in
     un certo modo, darà necessariamente un certo tipo di  risul-
     tati  una  volta  sottoposto all'analisi automatica.  Spesso
     questo fenomeno è sottovalutato, perché fra la codifica  del
     materiale  e  i risultati che si ottengono non c'è più alcun
     intervento umano, che generalmente comporta un  ripensamento
     successivo  dei  problemi.   Questa  è  del resto una tipica
     caratteristica dei procedimenti automatici.  (Nota 21)

     8. La codifica come sintesi del conosciuto

     In conclusione, la codifica rappresenta la  sintesi  formale
     di  quanto  conosciamo  dell'oggetto  che vogliamo studiare.
     Essa deriva in prima istanza, cioè al  momento  della  prima



                       Archeologia e calcolatori                9







     conscenza  che si ha dell'oggetto, soprattutto dalla dialet-
     tica fra le caratteristiche intrinseche dell'oggetto (forma,
     dimensioni, materiale...) e la competenza archeologica dello
     studioso. Il confronto fra questi due elementi viene attuato
     con  procedimenti sostanzialmente intuitivi, che determinano
     quali aspetti  dell'oggetto  prendere  in  considerazione  e
     quindi codificare.

     Ma  in  un secondo tempo, quando sono stati effettuati degli
     studi, eventualmente anche con procedimenti  automatici,  su
     quell'oggetto,  le  conclusioni  vengono  a  far  parte esse
     stesse delle nuove competenze archeologiche, e  quindi  con-
     sentono di allargare e complicare il modo con cui viene con-
     siderato l'oggetto, e dunque  la  sua  codifica.   L'aspetto
     soggettivo   insito   in   questa  situazione  non  dovrebbe
     spaventare, perché (se le procedure sono attuate in  maniera
     scientifica) non è più soverchiante di quello che esiste già
     all'origine. Inoltre, e soprattutto, se  i  procedimenti  di
     studio sono stati automatizzati, la memoria di tali procedi-
     menti consentirà sempre di avere un controllo  su  quanto  è
     stato fatto.  D'altra parte la convenienza di approfondire i
     lati teorici del procedimento di codifica deriva  dal  fatto
     che esso, nell'ambito dell'automazione, è quello in cui mag-
     giormente entrano elementi soggettivi, mentre gli altri pro-
     cedimenti dovrebbero obbedire a regole logiche obiettive.

     Da  ciò  consegue una delle caratteristiche più interessanti
     delle metodologie  informatiche,  ma  purtroppo  anche  meno
     tenute  in  conto fino a questo momento: la necessità di una
     completa trasparenza nella diffusione non solo dei risultati
     delle  ricerche,  ma  anche  degli algoritmi utilizzati, dei
     presupposti metodologici, e dell'esecuzione della  codifica.

     Un'ultima  considerazione  deve poi essere dedicata al fatto
     che non è prevedibile che l'archeologia  detta  quantitativa
     sia  destinata  a  sostituire  quella  che possiamo chiamare
     "concettuale", e quindi occorrerà mantenere fra i due metodi
     dei rapporti costruttivi.  Tali rapporti potranno soprattut-
     to essere basati sul momento della codifica.

     NOTE

     1. Bruce G. TRIGGER,  A History of  archaeological  thought,
     Cambridge  University  Press,  1989; Jean-Claude GARDIN, Ar-
     chaeological Constructs, Cambridge University Press-Editions
     de la Maison des Sciences de l'Homme, Cambridge-Paris, 1980;
     Francois  DJINDJIAN,  Méthodes  pour  l'archéologie,  Colin,
     Paris, 1991; Archeologia e Calcolatori, 1 (1990) e sgg.

     2.  Djindjian  (cap. 15: Des méthodes aux formalisations des
     raisonnements en archéologie; op. cit. p. 325-340) parla  di
     "formalisations  des raisonnements", che coincide con quello
     che intendo con "punto di vista informatico".  Egli tuttavia
     prende  in  considerazione i metodi, piuttosto che l'oggetto
     (parla infatti genericamente di "reconstruire le  passé,  p.



                       Archeologia e calcolatori               10







     326) e quindi può affermare che "l'archéologie n'existe pas,
     ou n'existe pas encore... il existe  des  archéologies"  che
     via  via  si rifanno al conetto tradizionale di "archéologie
     des antiquités", o alle scienze naturali,  o  all'antropolo-
     gia,  o  allo  strutturalismo,  etc.  A mio avviso, nel dis-
     tinguere i diversi ambiti applicativi, l'informatica  (uman-
     istica) deve piuttosto prendere in considerazione gli ogget-
     ti della ricerca. I metodi finiscono  per  essere  comuni  e
     "trasversali".

     3.  Trigger,  cit.,  sostanzialmente lo trascura. In effetti
     ancora l'archeologia  informatizzata  non  sembra  rientrare
     nell'orizzonte  di una "sotoria", e solo con l'avvento delle
     ricerche aiutate dal calcolatore si è avvertita la necessità
     di  formalizzare i linguaggi descrittivi. Cf. p.es. i lavori
     pionieristici di J.-Cl. GARDIN  e collaboratori  (serie  dei
     "Codes pour l'analyse...", Paris CNRS, 1976-78).

     4.  Gardin  (cit.  nota 1), cap. 3: The Analysis of Compila-
     tions.

     5. Djindjian (cit. nota 1) p. 99-100.

     6. Sulla distinzione fra informatica come tecnologia e  "in-
     formatica  teorica"  cf. T. ORLANDI, Informatica umanistica,
     realizzazioni e prospettive,  in:  AA.  VV.,  Calcolatori  e
     Scienze Umane, Milano 1992, p. 1-22 (sopr. p. 11-16).

     7.  Cf.  T. ORLANDI, Informatica Umanistica, Roma 1990, cap.
     2.

     8. Per una discussione più ampia, cf. G. ADAMO, La  codifica
     come rappresentazione, in: G. GIGLIOZZI (ed.), Studi di cod-
     ifica e trattamento  automatico  di  testi,  Roma  1987,  p.
     39-84.

     9. Trigger (cit. nota 1) p. 196.

     10. A. C. SPAULDING, Some Elements of Quantitative Archaeol-
     ogy, in: F. R. HODSON (etc., eds.), Mathematics in  the  Ar-
     chaeological  and Historical Sciences, Edinburgh 1971, p. 4.

     11. Djindjian (cit. nota 1) p. 76.

     12. Gardin (cit. nota 1), p. 38. In modo  più  "informatico"
     diremmo  che  si tratta dell'opposizione fra continuo e dis-
     creto e del relativo passaggio dall'uno all'altro, che  per-
     mette la comunicazione scientifica, e in particolare l'anal-
     isi informatica. Tuttavia esempi come  quello  del  progetto
     ARCOS  (cf.  Arch. & Calc. I, p. 179 sgg.) indicano come sia
     difficile esplicitare il confine fra i due sistemi.

     13. Mentre per Djindjian la codifica è sempre  in  vista  di
     una analisi quantitativa (cit. nota 1, p. 76 e p. 99), nella
     visione di Guimier-Sorbets può avere un valore  documentario



                       Archeologia e calcolatori               11







     in  se  stessa,  preliminarmente ai procedimenti di analisi.
     Cf. A.-M. GUIMIER-SORBETS, The Research Centre for Automatic
     Treatments  in  Classical Archaeology, "Computer and the Hu-
     manities" 20 (1986) 319-321; inoltre cf. nota 20.  L'accento
     è  posto  tuttavia sull'information retrieval con linguaggio
     naturale. Più difficile è stabilire quanto questo  approccio
     libero alla codifica (che in verità è quello che preferirem-
     mo, a certe condizioni) possa poi dar luogo ad analisi auto-
     matiche.

     14. Cf. Irigartua, cit. sotto (nota 15), p. 78.

     15. The Computer and the Historian's Work, "History and Com-
     puting 3 (1991) 75.

     16. Cf. Orlandi (cit. nota 7).  Su  questa  problematica  si
     fonda  il lavoro del prestigioso gruppo internazionale della
     Text Encoding Initiative, volto a formalizzare un  "linguag-
     gio di descrizione" dei testi che prevede preliminarmente la
     scelta accurata degli elementi da descrivere, e quindi codi-
     ficare.

     17.  Cf. F. KRITZINGER, M. SCHICK. W.-R. TEEGEN, Un calcola-
     tore disegna e registra ceramica antica: il sistema  ARCOS-1
     negli  scavi di Velia, comune di Ascea (Salerno), "Archeolo-
     gia e Calcolatori", 1 (1990) 179-210.

     18. Cf. Trigger (cit. nota 1), p. 19-21. La discussione a p.
     297-99  sulle  teorie  di Binford, sul significato della re-
     lazione fra tecnologia, organizzazione sociale, ideologia si
     può considerare basata sul valore documentario dato a questo
     proposito ad oggetti che  non  sono  nati  propriamente  per
     questo.

     19.  La codifica si inserisce così nel processo che torna su
     se stesso ben delineato da Gardin (cit.  nota 1) cap.  5,  e
     poi da Djindjian  (cit. nota 1) p. 334.

     20.  Per  questo  rimando  alla pubblicazione in corso di un
     seminario tenuto presso l'Accademia dei Lincei su "Strumenti
     Informatici   nelle   Discipline  Umanistiche:  il  Problema
     dell'Integrazione" (5 ottobre 1991). Si vedranno soprattutto
     i  contributi  di  Manfred Thaller e Anne-Marie Guimier-Sor-
     bets.

     21. E' interessante notare come Djindjian rifugga  dal  par-
     lare di informatica e automatismi quando delinea il suo sis-
     tema formalizzato (cit. nota 1, cap. 15). Probabilmente egli
     non  intende  automatizzarlo,  ma  dal nostro punto di vista
     formalizzazione e automazione (logicismo) in sostanza  coin-
     cidono.