Resumen
Con la gran cantidad de información que en la actualidad se obtiene en los proyectos de estudio de genomas, es necesario crear una estrategia para que los datos sean almacenados y estructurados de forma que sean fácilmente accesibles. Para tal efecto se desarrolló en Cenicafé un sistema de información de datos genómicos LIMS el cual, basado en su mayoría en herramientas libres, permitió construir un sistema a bajo costo y de alta calidad, con los aplicativos necesarios para asistir las necesidades en estudios de genómica. Este sistema está especializado para el manejo de información relacionada con secuencias de EST's, BACs y Microsatélites de varias especies de café, la broca Hypothenemus hampei y el hongo Beauveria bassiana. Para el análisis de la información se crearon "pipelines" específicos para proceder con el agrupamiento, análisis y anotación de las s ecuencias. Con esta información se generó un modelo relacional de bases de datos para su almacenamiento, se diseñaron interfaces Web con motores de búsqueda especializados y se incorporaron herramientas para despliegue gráfico de ensamblajes de genes, anotaciones, datos estadísticos y otra información relacionada. El presente sistema es accesible desde la Intranet de Cenicafé mediante un mecanismo de autenticación de usuarios, permitiendo acceder a los datos de forma rápida y eficiente. Este sistema se encuentra en constante cambio debido a las continuas actualizaciones de los datos obtenidos en los proyectos de genoma de Cenicafé y de los datos de secuencias contenidos en los bancos de datos mundiales.
Palabras clave
Citas
Altschul, S.F., Gish,W., Miller,W., Myers, E.W. and Lipman, D.J. 1990. Basic local alignment search tool. J. Mol. Biol., 215, 403-410.
Ashburner M, Ball CA, Blake JA, Botstein D, Butler H, Cherry JM, Davis AP, Dolinski K, Dwight SS, Eppig JT. 2000. Gene Montology: tool for the unification of biology. The Gene Ontology Consortium. Nat Genet 25: 25-29.
Bailey TL, Williams N, Misleh C, Li W. 2006. MEME: discovering and analyzing DNA and protein sequence motifs. Nucleic Acids Research 34:W369-W373.
Burge, C., Karlin, S. 1997. Prediction of complete gene structures in human genomic DNA. J. Mol. Biol. 268: 78-94.
Charu G. K, Richard LeDuc, George Gong, Levan Roinishivili, Harris A. Lewin, Lei. Liu, W.M. Keck. 2004. ESTIMA, a tool for EST management in a multi-project environment. BMC Bioinformatics 5: 176-200.
Darling A. 2008. mpiBLAST open source project, http://MPIBLAST.lanl.gov/
Ewing B, Hillier L, Wendl M, Green P. 1998. Basecalling of automated sequencer traces using phred. I. Accuracy assessment. Genome Research 8: 175-185.
Gish W. 2005. WU BLAST 2.0. [http://blast.wustl.edu/blast/README.html]
Li K-B. 2003. ClustalW-MPI: ClustalW analysis using distributed and parallel computing. Bioinformatics 19: 1585-1586.
Mueller LA, Solow TH, Taylor N, Skwarecki B, Buels R, Binns J, Lin C, Wright MH, Ahrens R, Wang Y, Herbst EV, Keyder ER, Menda N, Zamir D, Tanksley SD. 2005. The SOL Genomics Network. A Compar ative Resour ce for Solanaceae Biology and Beyond. Plant Physiology 138:1310 - 1317.
Mulder NJ, Apweiler R, Attwood RK, Bairoch A, Barrell D, Bateman A, Binns D, Biswas M, Bradley P, Bork P, et al. 2003. The Interpro database, 2003 brings increased coverage and new features. Nucleic Acids Res 31: 315-318.
Pertea G, Huang X, Liang F, Antonescu V, Sultana R, Karamycheva S, Lee Y, White J, Cheung F, Parvizi B, Tsai J, Quackenbush J. 2003. TIGR Gene Indices clustering tools (TGICL): a soft-ware system for fast clustering of large EST datasets. Bioinformatics 19: 651-652.
Rhee, S.Y., Julie Dickerson, Dong Xu. 2006. Bioinformatics and its Applications in Plant Biology. Annu. Rev. Plant. Biol. 57: 335-360. Rice, P., Longden, I., Bleasby, A. 2000. EMBOSS: the European Molecular Biology Open Software Suite. Trends Genet. 16:276-277.
Rozen S, Skaletsky HJ. 1998. Primer3. Code available at http://www-genome.wi.mit.edu/genome_software/other/primer3.html. Smit, AFA, Hubley, R, Green, P. RepeatMasker Open-3.0. 1996-2004 <http://www.repeatmasker.org>.
Stein LD, Mungall C, Shu S, Caudy M, Mangone M, Day A, Nickerson E, Stajich JE, Harris TW, Arva A, et al. 2002. The generic genome browser: a building block for a model organism system database. Genome Res 12: 1599-1610.
Teufel, A, Markus Krupp, Arndt Weinmann, Peter R. Galle. 2006. Current bioinformatics tools in genomic biomedical research (Review). International Journal of Molecular Medicine 17:967-973.
Thiel T, Michalek W, Varshney RK, Graner A. 2003. Exploiting EST databases for the development and characterization of gene-derived SSR-markers in barley (Hordeum vulgare L.). Theor Appl Genet 106: 411-422.
Zdobnov EM, Apweiler R. 2001. InterProScan-an integration for the signature-recognition methods in InterPro. Bioinformatics 17:847-848.
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-SinDerivadas 4.0.
Derechos de autor 2023 Revista de la Academia Colombiana de Ciencias Exactas, Físicas y Naturales