Por Ana Maria Pertierra
Un hallazgo revolucionario
en la interpretación del genoma
Especialistas españoles en bioinformática encontraron que ciertas proteínas -llamadas quiméricas- que se originan a partir de la transcripción de varios genes están presentes en tejidos sanos. Este descubrimiento podría cambiar la perspectiva sobre el proceso de transferencia de información desde los genes a las proteínas, y plantea nuevos desafíos para entender muchas patologías
Dr. Alonso Valencia director del Programa
de Biología
Estructural y Biocomputación del Centro Nacional
de Investigaciones Oncológicas (CNIO) de Madrid, España
Científicos del Centro Nacional de Investigaciones Oncológicas (CNIO) de Madrid y del Centro de Regulación Genómica (CRG) de Barcelona descubrieron que en células y tejidos sanos hay ciertas proteínas, a las que llaman quiméricas, que surgen de la transcripción de varios genes distintos. Este fenómeno, que hasta ahora se consideraba poco frecuente y exclusivo de procesos anómalos como el cáncer, estaría mediado por los ARN quiméricos resultantes de fragmentos de varios genes. Estos resultados dan por tierra con el paradigma clásico que asocia un gen con una proteína y revela que la codificación de la información genómica es mucho más compleja de lo que los especialistas creían.
El hallazgo, que acaba de publicarse en Genome Research donde también aparece en la ilustración de la tapa, da cuenta de las potenciales funciones de ciertas proteínas que están codificadas por ARN quiméricos. Los ARN quiméricos se producirían combinando la información de dos o más genes distintos, a diferencia de lo que ocurre con el ARN normal que se origina como el transcripto de un solo gen. Esta novedad plantea múltiples interrogantes y desafíos para futuras investigaciones.
El ARN (Acido ribonucleico) es la molécula que dirige las etapas intermedias de la síntesis proteica transfiriendo la información que se encuentra en los genes del ADN para la síntesis de las proteínas necesarias para las distintas actividades celulares.
Los bioinformáticos del CNIO y del CRG investigando en las bases de datos de genes identificaron 175 ARN transcritos quiméricos presentes en 16 tejidos humanos y 12 proteínas quiméricas nuevas.
FABAINFORMA tuvo acceso a una comunicación a través del correo electrónico con Alfonso Valencia, biólogo investigador líder del trabajo, director del programa de Biología Estructural y Biocomputación del CNIO y jefe del grupo de Biología Computacional Estructural del Centro.
- ¿Cuál ha sido el objetivo principal del estudio que acaban de publicar en la revista Genome Research? ¿Y cuáles las conclusiones que más repercutieron en la comunidad científica?
Una de las conclusiones más sorprendentes del Proyecto Genoma Humano fue que el número de genes presentes en el organismo humano es aproximadamente de 20.000, un número relativamente pequeño comparado con la complejidad de las funciones desarrolladas.
Esta paradoja se explica en parte porque el número de proteínas que se producen en el organismo es mucho mayor al del número de genes que las codifican. Este proceso de transferencia de información ocurre a partir de unas unidades o elementos de información, los exones, presenten en los genes, y que se combinan para dar lugar a más de una proteína.
En esta investigación hemos utilizando las posibilidades que ofrecen las nuevas técnicas de secuenciación masiva para revelar que este proceso combinatorio puede no sólo darse entre los exones de un mismo gen, sino también entre los exones de genes distintos. De este modo, hemos descubierto que se producen auténticas quimeras, que como en el animal mitológico, combinan características de dos genes distintos (en la mitología de dos especies).
Este descubrimiento supone una revolución en la idea clásica que asocia un gen con una proteína, dando lugar a un nuevo concepto que relaciona dos genes distintos con una proteína quimérica.
Hasta el momento se habían descrito en la literatura varios casos que hacían referencia a estos procesos, pero se limitaban a contextos específicos como el cáncer. Nuestro equipo ha demostrado que esto también ocurre en células y tejidos sanos, y que es más común de lo que se pensaba.
- ¿Por qué plantean un cambio de paradigma cuando consideran la presencia de ARN y proteínas quiméricos en tejidos sanos?
Este descubrimiento podría cambiar nuestra perspectiva sobre un proceso elemental en el funcionamiento de las células, que es el traspaso de información de los genes a las proteínas, y que tiene implicaciones muy importantes en la fisiología celular. El hecho de que se produzcan ARNs y proteínas a partir de diferentes genes abre nuevas perspectivas destinadas al estudio de nuevos procesos que pueden ser muy reveladores en el entendimiento de muchas patologías, no sólo relacionadas con cáncer.
- ¿Qué perspectivas se abren ante estos hallazgos?
Este nuevo hallazgo plantea muchas preguntas. Ahora nuestros esfuerzos tienen que ir dirigidos a caracterizar de modo directo la función de estos ARNs y proteínas quiméricas recientemente descubiertos, y a asociarlos tanto a procesos fisiológicos específicos como a posibles procesos patológicos, y en especial, a alteraciones relacionadas con la evolución de los tumores humanos.
- ¿Cómo está constituido el grupo de trabajo del CNIO responsable de este trabajo de investigación?
La principal contribución al trabajo corresponde a Milana Morgenstern, del CNIO, que fue la responsable de realizar el diseño de los experimentos, así como la interpretación y el análisis de la función de las proteínas. La contribución de otros miembros del grupo ha sido también relevante, y ha consistido en el análisis de calidad de los datos de secuenciación y proteómica, así como búsquedas intensivas en bases de datos.
Los experimentos de proteómica se han realizaron en el Instituto Weizmann, en Israel, que dispone de una gran experiencia en este campo. El Centro de Regulación Genómica (CRG), en Barcelona, ha sido fundamental para la obtención de los datos de secuenciación de ARN y el análisis de los datos disponibles en bases de datos.
- ¿Qué tipo de metodologías han aplicado y sobre qué células y/o tejidos?
Los estudios computacionales han incluido bases de datos que cubren información experimental de secuenciación de ARN y datos de espectrometría de masas correspondientes a un gran número de tipos biológicos distintos. Los experimentos han sido realizados principalmente en colecciones de líneas celulares.
- ¿Qué proyectos futuros están evaluando?
La parte computacional del trabajo ha continuado con un análisis estadístico de las funciones asociadas a las quimeras detectadas. Este estudio, publicado en la revista Bioinformatics, describe un escenario específico para las quimeras como parte de mecanismos de dominancia negativa en varios procesos biológicos.
Desde el punto de vista experimental, es importante verificar los resultados en colecciones más complejas de tejidos, tanto normales como tumorales. En este sentido, será de especial relevancia la secuenciación de ARNs procedentes de células individuales.
También estamos interesados en estudiar en detalle quimeras específicas que puedan tener relevancia biológica.
Bioinformática: una disciplina de vanguardia
La bioinformática es un nuevo campo de la ciencia en el que confluyen varias disciplinas como: la biología, la computación y la tecnología de la información. Es un área de investigación multidisciplinaria, que surge para dar solución a problemas complejos de la biología que no se pueden resolver con cálculos sencillos, y constituye una herramienta fundamental para el estudio genómico.
Los términos bioinformática, biología computacional y biocomputación hacen referencia a campos de estudios interdisciplinarios muy vinculados, que requieren el uso o el desarrollo de diferentes técnicas que incluyen informática, matemática aplicada, estadística, ciencias de la computación, inteligencia artificial, química y bioquímica para solucionar problemas, analizar datos, o simular sistemas o mecanismos, todos ellos de índole biológico, y usualmente (pero no de forma exclusiva) a nivel molecular. El núcleo principal de estas técnicas se encuentra en la utilización de recursos computacionales para solucionar o investigar problemas sobre escalas de tal magnitud que sobrepasan el discernimiento humano. La investigación en biología computacional se solapa a menudo con la biología de sistemas.
Los principales esfuerzos de investigación en estos campos incluyen el alineamiento de secuencias, la predicción de genes, montaje del genoma, alineamiento estructural de proteínas, predicción de estructura de proteínas, predicción de la expresión génica, interacciones proteína-proteína, y modelado de la evolución.
Una constante en proyectos de bioinformática y biología computacional es el uso de herramientas matemáticas para extraer información útil de datos producidos por técnicas biológicas de alta productividad, como la secuenciación del genoma. En particular, el montaje o ensamblado de secuencias genómicas de alta calidad desde fragmentos obtenidos tras la secuenciación del ADN a gran escala es un área de alto interés. Otros objetivos incluyen el estudio de la regulación genética para interpretar perfiles de expresión génica utilizando datos de chips de ADN o espectrometría de masas. |
|
|