Mi experiencia en la supercomputación con Caléndula
Tras algún intento de probar la supercomputación para mi tesis doctoral, finalmente he podido tener acceso al servicio prestado por la Fundación del Centro de Supercomputación de Castilla y León donde pude disfrutar de darle a los comandos para usar algún que otro core de Caléndula, que así se llama el «monstruo» en cuestión.
El curso trataba de los análisis de metagenomas mediante supercomputación con mucha temática dirigida al uso de la ultrasecuenciación. Como ya les comenté a los organizadores, es una pena que exista una muy deficiente base informática en los investigadores de biología molecular. De los 19 presentes, yo era el único que sabía teclear en condiciones instrucciones en UNIX. Pero seguro que, al menos los asistentes, espabilarán. Casi todos mostraron interés por probar de una vez alguna distribución de Linux.
Pasando al meollo, la verdad es que para un friki de la tecnología como yo es un curso muy recomendable. A parte del título que te brinda por un precio nada despreciable de 350€ (más que ajustado ante los demás cursos ofertados sobre temas bioinformáticos a nivel nacional), la experiencia de meterse de lleno en análisis de secuencias genómicas y metagenómicas procedentes de distintos sistemas de próxima generación como los Roche 454 o los HiSeq de Illumina es apasionante. Trabajar de forma práctica siguiendo todos los pasos como si fuera un proyecto real abre mucho la mente ante todo el trabajo que hay detrás de un análisis de este estilo. Eso y que no estoy sólo en esto del frikismo bioinformático.
Hubo una primera parte en la que Jesús Lorenzana, uno de los responsables directos de Caléndula, nos dio unas nociones técnicas del proceso del sistema de supercomputación instalado en el CRAI-TIC de la Universidad de León. Datos técnicos que para algunos sólo servirán para aburrir pero que quitan el hipo cuando te has pasado años montando equipos.
Después Mariví López nos dio las nociones básicas para manejarse en condiciones en el entorno Linux. Cosas simples, sí, pero que incluso a un autodidacta como yo vienen bien recordar de vez en cuando. Muchas de las órdenes que he dado a través del terminal las he tecleado por inercia sin saber específicamente alguno de los atributos. Pero bueno, también son más de 12 años aprendiendo a fuerza bruta y me vino genial. Algunos comandos que luego se necesitaron no se pudieron dar, pero no hubo problemas puesto que dichas órdenes fueron necesarias posteriormente en otra clase en la que la falta de tiempo no era lo primordial y se aprendieron sobre la marcha sin problemas.
La tarde de ese primer día fue más relajada tras el «estrés» mañanero Jesús A. Gómez-Ochoa hizo una muy sensata introducción a la bioinformática preguntando al principio cuál era nuestra experiencia y que facilitó la orientación de la charla.
En la mañana del segundo día, Alexander Sánchez Pla introdujo los sistemas de secuenciación de próxima generación y nos mostró el uso de FastQC en modo gráfico, muy importante para comprender y comparar lo que tenemos delante tras pasar nuestro ADN por un Illumina.
Aunque todas las clases fueron amenas, en el momento en el que llegó la hora de picar comandos para analizar datos de verdad el caos se hizo presente. Posiblemente el profesor encargado de la partes de RNAseq creyó que todos tenían un background en el uso de linux lo suficientemente correcto como para no estar pensando más en la orden que dar que en el análisis en sí, en los pasos a dar. La ejecución de los scripts que es básica llegó como un jarro de agua fría para mis compañeros. Y es normal. Posiblemente en otras ediciones se baraje dar una formación algo más gradual dejando esta parte de RNAseq casi para el final. Todo también unido a que fue la última clase de la mañana y la falta de azúcar hizo estragos.
Las sesiones vespertinas posteriores fueron teóricas iniciándose con el análisis mediante el uso de Microarrays por Enrique J. de Andrés Galiana. Una ponencia que, desde mi punto de vista, fue muy matemática y en la que me sentí bastante perdido.
Javier Tamames siguió con su parte dedicada al análisis de la diversidad microbiana y de metagenómica explicando todos y cada uno de los pasos a seguir para cada tipo de experimento. Con una página web creada para el curso como apoyo tanto para él como para los alumnos y agilizando el aprendizaje correctamente, se intercalaron los usos de la supercomputación con herramientas vía web para análisis menos exigentes. La repetición de los pasos y la consecución de los análisis siguiendo esas instrucciones provocó una buena asimilación de estos estudios que se basaban en análisis de secuencias del 16S con sistemas Roche 454.
Las prácticas con el Dr. Tamames duraron hasta el último minuto del último día de clase mañanera, tras el cuál nos dispusimos a visitar el sistema de supercomputación Caléndula. Jesús nos desgranó, a nivel comprensible por todos, tanto los sistemas de emergencia como las tecnologías que componen el gigantesco puzzle de supercomputación que hasta hace poco se encontraba entre el Top 500 mundial.
Para que notéis la sensación de estar en el superordenador, os pongo a continuación el sonido ensordecedor grabado in situ.–>PULSAR AQUÍ para escuchar el sonido del supercomputador.
Aunque tras terminar el curso no se había podido asimilar todo el temario, la disponibilidad para descargarse todo lo impartido y tener acceso a Caléndula durante la semana siguiente (para mí poco tiempo debido a la cercanía de la Semana Santa y que soy un biólogo algo inquieto), provoca que se pueda exprimir al máximo el evento. Aunque para mí, una semana me supo a poco. Ojalá, en un futuro no demasiado lejano, todos los inquietos por estos sistemas de análisis se puedan dividir en categorías para saciar las distintas mentes. Pero al día de hoy es una buena experiencia que no está al alcance de muchos. Eso sí, después de ver las tripas de Caléndula se me va a hacer pequeño cualquier otro sistema informático convencional.
Agradecimientos: quiero dar las gracias tanto a todos y cada uno de los instructores por su paciencia y buen hacer y en especial a Jesús Lorenzana y Ruth Alonso por la ayuda prestada para la recopilación de datos e imágenes para este artículo.
Continue reading