El banc de dades de Flora i Vegetació (FloraCat)



1. La Base de dades de Flora i Vegetació

2. El procés d’informatització

1. La Base de dades de Flora i Vegetació (FloraCat)

Aquest projecte neix de la col·laboració entre el Departament de Biologia Vegetal de la Universitat de Barcelona i la Direcció General del Patrimoni Natural del Departament de Medi Ambient de la Generalitat de Catalunya.

La recopilació de citacions florístiques i d’inventaris de vegetació es va iniciar a les acaballes de 1993 i ha continuat ininterrompudament fins avui. A la fig. 1 es pot veure l’increment del nombre de dades per any.

La Base de dades de la Flora i la Vegetació de Catalunya té per objectius dins el marc territorial de Catalunya:

- La recopilació (informatitzada) de tota la bibliografia especialitzada referent a la Flora vascular (pteridòfits, gimnospermes i angiospermes) i a la Vegetació (inventaris de vegetació).

- El recull de totes les citacions florístiques (amb llur informació topogràfica, taxonòmica i ecològica) aparegudes a la bibliografia.

- La recopilació d’inventaris de vegetació (amb llur informació topogràfica, estructural i ecològica) apareguts a la bibliografia.

A dia d'avui (maig de 2014) FloraCat conté de 1.811.157 citacions florístiques de cormòfits (pteridòfits, gimnospermes i angiospermes) i més de 22.260 inventaris de vegetació.

Fig. 1- Increment acumulat, durant el període 1993-2013, del nombre de citacions florístiques i d’inventaris de vegetació per any al Banc de dades de Flora i Vegetació.

El buidatge d’inventaris, pretesament exhaustiu, es va finalitzar l’any 1996. A hores d’ara s’actualitzen les novetats i està ja molt avançada l’entrada de citacions florístiques.

 

 


Inici

 

2. El procés d’informatització d’inventaris i de citacions florístiques

Els inventaris de vegetació han estat informatitzats mitjançant el programa XTRINAU 2.0 (X. Font, 1990). Cada taula és emmagatzemada en un fitxer ASCII. El conjunt de les taules constitueix una base de dades d’inventaris que és consultable al Dept. de Biologia Vegetal, sobretot per a la realització de treballs d’investigació de revisió sintaxonòmica. Aquestes taules són, mitjançant CONVERBD, exportables a FloraCat.

Especialment innovadora creiem que és la informatització de dades florístiques. Aquest procés es basa en l’escombrada de tot el text mitjançant un escanner i la seva posterior lectura amb un programa OCR (en el nostre cas utilitzem OMNIPAGE 11 i Presto 4.0). Un cop l’obra ha passat per l'OCR, tenim el text en format ASCII, verifiquem la seva correcció i hi posem les marques de descripció de contingut amb l’editor Kedit (versió 5.0). Aquestes marques corresponen a senyals del llenguatge de descripcions de citacions florístiques XFLORA (X. Font 1997). Aquest llenguatge de marques serveix per descriure la mena de dada que les segueix inmediatament per la dreta i, treballant conjuntament amb el programa IntXflor, transforma les dades en format ASCII-XFLORA al format DB2 de FloraCat. A la fig. 3 podeu veure l’aspecte d’una obra un cop afegides les marques de XFLORA.

Aquest procés, a més d’accelerar de manera notable l’entrada de dades, presenta un segon avantatge, al nostre entendre decisiu, consistent en que l’obra informatitzada amb format XFLORA gairebé manté l’estructura inicial de la font bibliogràfica, cosa que facilita molt la pesada feina de correcció. Un tercer aspecte important del sistema és que recull tota la informació de l’obra, i no solament la referent a les citacions. La feina de posar marques pot semblar laboriosa , però, ho és menys que mecanografiar tot el text -cosa que s’ha de fer quan les obres tenen una mala qualitat d’impressió- i a més hi ha nombroses macros de Kedit que la faciliten molt. Per exemple, totes les marques que indiquen l’inici del tàxon es posen a lloc de manera automàtica ja que, en disposar de tesaures de noms, el programa pot identificar les espècies en el text i posar-hi les marques adients. Els UTM són també identificables de manera automàtica, etc.

Amb molt poca feina aquest sistema d’informatització de dades textuals es pot adaptar a d’altres grups taxonòmics. Cal només redefinir el significat d’algunes marques o bé crear-ne de noves; si es dóna aquesta segona opció, cal, però, modificar el programa que interpreta les dades (IntXflor).

La introducció de dades ha estat realitzada per Diana Cillero, Mercedes Guerrero, Rafael Quadrada, Mercè Caselles, Noemí Reig, Isabel Afán, Anna Galera, David Pérez, Joel Torra, Neus Nualart i Sara López sota la direcció de Xavier Font.

Fig. 2- Procés d’introducció a FloraCat, via OCR i XFLORA, de les obres bibliogràfiques amb citacions florístiques

 

 

Fig. 3- Aspecte, amb l’editor Kedit, d’una obra bibliogràfica amb les marques de descripció florística de XFLORA.


Inici