
El “big data” (o dades massives) és un terme que s’ha anat introduint al nostre llenguatge, i es resumeix com la suma de dades, procediments i aplicacions informàtiques que sobrepassen els tractaments habituals i que tendeixen a conèixer patrons o comportaments, amb el creuament d’un nombre elevadíssim d’informació variada.
En aquest sentit la genealogia és un camp on hi ha molt marge de treball, però té com a base una informació, recopilada al llarg dels anys i segles, què dificilment pot ser uniformada.
Malgrat tot sí que hi ha hagut alguns indicis (promoguts parcialment per alguns portals) de globalitzar aquesta informació, per exemple determinar geogràficament l’origen dels cognoms, o dels noms…
El que s’està fent d’una manera puntual, és el que se’n denomina “buidatge” que es podria identificar, com el fet puntual de reproduir les dades manuscrites d’un llibre(s), a un format amb capacitat de ser tractat informaticament.
En aquest sentit no hi ha uniformitat, tant de forma com de fons. Quasi tots els arxius (bàsicament eclesiàstics) no tenen el mateix criteri i així mentre el Bisbat de Tarragona té digitalitzats els llibres i es veuen en xarxa amb el format original, a la comunitat valenciana tenen fet el buidatge, a través d’una entitat, i per tant es pot consultar amb una base de dades per cognoms, diòcesi i parròquies…
Qui més ho ha treballat a nivell mundial, ha estat l’església dels mormons, què inicialment digitalitzava en rodets i que ara permet l’accés a una base de dades mundial, moltes vegades amb accés al original.
També en aquest sentit les hemeroteques han reproduït i buidat originals, però s’ha fet, basicament, per personal no especialitzat, i això pot comportar errades d’interpretació.
- D’una part pensem que les dades, fins fa un segle, es reproduien oralment, i el grau d’analfabetisme era gran; per tant en una inscripció administrativa, o religiosa, el funcionari o el capellà escrivia el que entenia (ja que la persona interessada a inscriure l’acta, no podia verificar-ho al no saber llegir.
- .Si també incorporem dades d’altres paisos, per exemple gent resident a Cuba que anaven a Nova York, hi havia dificultat d’idioma, i els noms i dades podrien tenir errades significatives.
- A més el buidatge s’ha fet per persones què, amb la millor voluntat, no coneixen ni els indrets, ni els cognoms més habituals en un indret, pot afegir-hi més incertesa.
- Si pensem que no hi ha a posteriori un protocol de revisió, o d’accés a possibles rectificacions…
- Tenint en compte que una dada pujada a la xarxa pot reproduir-se a nivell mundial, l’errada pot tenir efectes multiplicadors.
- Però si aquesta presumpta errada fos certa, ens perdríem línies d’avantpassats i pensaríem que no han tingut descendència.
- Molta d’aquesta documentació s’ha fet de forma temporal per obligació, i aquestes dades poden no ser del tot exactes.
Tampoc podem anar massa lluny fins arribar a un moment en que els parentius s’enllassessin de forma informàtica, per el sol fet de tenir coincidències, quan la genealogia està feta de parentius entrecreuats, i altres lligams (algunes vegades) fruit més del sentit pràctic que de les normes socials.
Un altre cas és el d’alguns programes informàtics que “llegeixen” directament els fulls de diaris antics i, en aquests casos, les possibilitats d’error augmenten, en especial en edicions del segle XIX, on la composició manual de les paraules, i el desgast de les mateixes, no sempre són ben reproduïdes.
Però el cert és que les poques referències que ens han deixat els nostres avantpassats, les hem de tractar amb la prudència que cal.
El que sempre he fet, i ho recomano, és que una dada o un fet pugui ser verificat per una altra font, i posar-la en context amb la resta de membres que formin la família, i sempre anar a documents originals.