Introducción
Los experimentos dialélicos están relacionados con estudios genéticos, así como con programas de fitomejoramiento, producción de semillas, generación, validación, aplicación y transferencia de tecnología (Martínez, 1988; González et al., 2007a, b; Pérez et al., 2019; González et al., 2019). Los diseños genéticos que se usan para formar familias de autohermanos, medios hermanos y hermanos completos, dentro y entre poblaciones de la misma variedad, raza, especie y género, son cruzas entre dos progenitores, policruza, cruza de prueba, diseños I, II y III de Carolina del norte, métodos 1, 2, 3 y 4 de Griffing, línea por probador (Shattuck et al., 1993; Harriman y Nwammadu, 2016; Nduwumuremyi et al., 2013; Awata et al., 2018), triple cruza de prueba, análisis tri y cuatrialélico, retrocruza y dialélicos incompletos (Kempthorne y Curnow, 1961; Soriano, 2000; Mumtaz et al., 2015).
Otro análisis propuesto en especies autógamas o en las que se pueden derivar fácilmente líneas puras, se atribuye a Jinks y Hayman (1953); Hayman (1954 a, b); Jinks (1954), fundamentado en la estimación de seis tipos de varianzas y covarianzas entre parientes. Gardner y Eberhart (1966) diseñaron otra metodología en la que cada progenitor es una población con apareamiento aleatorio, está en equilibrio Hardy-Weinber, y hay dos alelos por locus. En la evaluación del material genético en áreas homogéneas se ha aplicado el diseño completamente al azar. Con un gradiente de variación no deseable, pero predecible, se ha elegido bloques completos al azar.
Con dos gradientes de heterogeneidad ambiental, uno perpendicular al otro, se ha empleado un cuadrado latino o algún látice (Gomez y Gomez, 1984; Martínez, 1988; Borojevic, 1990), pero han sido más usadas las series de experimentos en tiempo y espacio en bloques completos al azar o en látices (González et al., 2007a, b; Martínez, 1988; Moore y Dixon, 2015; González et al., 2019). Los diseños de apareamiento y experimentales se usan para estimar efectos y varianzas genéticas y ambientales, heredabilidad, heterosis, respuesta a la selección, predicción de híbridos, como material para nuevos programas de fitomejoramiento o como sugerencia para siembra comercial (Rodríguez et al., 2016; Vesali et al., 2020; Aditika et al., 2020; Vasconcelos et al., 2020). En el contexto anterior, se hará énfasis en los cuatro métodos de Griffing (1956a, b), que son los más utilizado desde los 1950’s. También se citan algunos paquetes estadísticos disponibles en sus sitios WEB, como versiones académicas o comerciales.
Materiales y métodos
Suposiciones usadas en una cruza dialélica
Christie y Shattuck (1992) discutieron cuatro diseños básicos considerando la ACG y ACE (Griffing, 1956b), los arreglos de varianzas y covarianzas (Jinks y Hayman, 1953; Hayman, 1954b; Jinks, 1954; Jinks, 1956), los efectos aditivos y dominantes (Eberhart y Gardner, 1966; Eberhart y Gardner, 1966) y los dialélicos incompletos (Kempthorne y Curnow, 1961). En éstos, como en otras técnicas dialélicas, hay alguna suposición o restricción para la estimación de parámetros genético-estadísticos (Martínez, 1988; Sahagún, 1998; Soriano, 2000; Awata et al., 2018).
Los cuatro métodos de Griffing no están condicionados por hipótesis o suposiciones genéticas (Wright, 1985; Christie y Shattuck, 1992; Shattuck et al., 1993; Hallauer et al., 2010). En la técnica de Hayman y Jinks se considera segregación diploide, progenitores homocigóticos, no diferencias entre cruzas directas y recíprocas, ausencia de epistasis y no ligamiento entre genes, ausencia de alelos múltiples, y distribución independiente de los genes en los progenitores. En las metodologías de Gardner y Eberhart sólo se asume que cada progenitor se encuentra en equilibrio Hardy-Weimberg y que en cada locus hay solo dos alelos.
Métodos de Griffing
Griffing (1956 b) propuso una técnica dialélica para estimar ACG y ACE, así como la naturaleza y el tipo de acción génica involucrada en la herencia de caracteres cuantitativos que se manifiestan en plantas y animales; ésta puede variar en su diseño y en su análisis biométrico si progenitores, cruzas simples directas o cruzas simples recíprocas (p, CD y CR, respectivamente) son incluidos. Con base en las combinaciones que se pueden formar cuando se consideran p padres, en parejas diferentes
, se tendrá: método 1: las p2 familias se denominan dialélico completo e incluyen p, CD y CR
Método 2: en este dialélico medio hay
p(p+1)/2 familias (p y CD). Método 3: este dialélico modificado analiza CD y CR; hay
p2 - p familias. Método 4: se obtienen
p (p-1)/2 familias (sólo CD).
Modelos genético-estadísticos
En los ocho análisis que se originan combinando los modelos de efectos fijos (I) y aleatorios (II) con sus cuatro métodos, Griffing (1956b) centra su discusión en un diseño de bloques completos al azar, para un ambiente, hay b repeticiones, a genotipos y c observaciones en cada parcela experimental.
Método 1
Donde:
= media poblacional;
= efectos de ACG para los progenitores i, j,
= efectos de ACE para esa pareja de progenitores;
= efecto originado por su cruza recíproca;
= efecto ambiental que afecta a cada ijkl- ésima observación, ésta última también se conoce como residual del modelo. Las componentes de los modelos I, que se muestran a continuación, se definen en los mismos términos que para el método 1.
En los cuatro métodos, con excepción de
, las otras componentes son variables aleatorias.
Método 2
Modelo I:
Método 3
Método 4
Aplicaciones en las cuatro metodologías
El método 1 se ha usado más frecuentemente en fitomejoramiento para estimar efectos y varianzas de aptitud combinatoria, efectos recíprocos y maternos, acción génica, heterosis, heredabilidad, predicción de híbridos sobresalientes y respuesta a la selección, como puede constatarse en los estudios realizados por González et al. (2007 b); Amissah et al. (2019); Lima et al. (2019); Yaw et al. (2020), entre otros. La estimación de parámetros genéticos con el método 2 en papa (Solanum tuberosum L.); maíz (Zea mays L.); gerbera (Gerbera x hybrida), entre otras especies, han sido realizados por Muhiuyuza et al. (2016); Oliveira et al. (2016); Mbusa et al. (2017); Rivera-Colín et al. (2019); Muhumuza et al. (2020). Éste se ha usado para estimar aptitud combinatoria, heterosis, heredabilidad, acción génica, depresión endogámica y predicción de híbridos superiores.
Con el método 3, Rodríguez-Pérez et al. (2016); Ngalio et al. (2019); Barreta et al. (2019); Vesali et al. (2020) han estimado parámetros genéticos en maíz, camote (Ipomoea batatas L.) y papa, pero en éstos no se estimó heterosis debido a que en el análisis no se incluyen progenitores. En los estudios de Muhinyuza et al. (2016); Anyanga et al. (2016); Barroso et al. (2019); Aditika et al. (2020); Vasconcelos et al. (2020) se ha destacado la relevancia que tiene el método 4 en la estimación de parámetros genéticos, en éstos se ha dado prioridad al análisis y discusión de los efectos de aptitud combinatoria general y específica, heredabilidad en sentido amplio y estrecho, y en la predicción de híbridos de mayor producción.
Software disponible
Algunos paquetes estadísticos que se encuentran disponibles en la internet, para el análisis de experimentos de cruzas dialélicas, son: Statistical Analysis System (SAS), Agrobase, Indostat, AGD-R (Analysis of Genetic Design in R), PBTools (Plant Breeding Tools in R), TNAUSTAT (Plant Breeding-Heterosis), OPStat, y Genes, entre otros.
Resultados y discusiones
El fitomejoramiento se puede dividir en tres etapas: la reunión o creación de un acervo de germoplasma variable, la selección de individuos superiores en el acervo y su utilización para crear una nueva y mejor variedad. En éstas la estimación de parámetros genéticos, como la varianza genética y la heredabilidad, pueden ser de gran valor (Dudley y Moll, 1969). En estudios genéticos y de fitomejoramiento el diseño de apareamiento y ambiental (experimental), así como el arreglo de siembra que se elija son muy importantes para generar el tipo de familia requerido, para disminuir el residual del modelo matemático, para optimizar el tiempo destinado al ensayo, y para estimar con mayor precisión los parámetros poblacionales que permitan obtener conclusiones correctas (Sahagún, 1998; Mumtaz et al., 2015; Harriman y Nwammadu, 2016; Awata et al., 2018).
Nduwumuremyi et al. (2013) puntualizaron que la elección de un grupo de progenitores y de un diseño genético apropiados son elementos clave para desarrollar programas de fitomejoramiento exitosos y que éstos, están condicionados por los objetivos del estudio, el tiempo, el espacio, los costos y otras restricciones biológicas. Con relación al diseño de apareamiento deberá considerarse el tipo de polinización predominante (por viento o insectos), la forma de diseminación del polen (por viento o insectos), si hay esterilidad genética o citoplásmica, los objetivos de la investigación, y el tamaño de la población requerida, entre otros (Nduwumeremyi et al., 2013; Mumtaz et al., 2013; Fasahat et al., 2016).
Desde los 1950’s se han diseñado diversas técnicas dialélicas pero las que más se usan son las de Griffing, Hayman y Jinks, y Gardner y Eberhart (Christie y Shattuck, 1992; Shattuck et al., 1993; Hallauer et al., 2010; Nduwumuremyi et al., 2013). Cockerham (1963) clasificó los diseños de apareamiento en categorías de uno, dos, tres y cuatro factores, dependiendo del número de ancestros por progenie sobre los cuales se ejerce control. La policruza (un factor) es suficiente para detectar variabilidad genética; con la cruza dialélica, con los diseños I, II y III de Carolina del norte y con el dialélico parcial (dos factores) se puede estimar varianza aditiva y de dominancia, la epistasis o el ligamiento entre genes se puede calcular usando cruzas tri y cuatrialélicas (tres y cuatro factores) o con la combinación de alguno de estos diseños.
Fasahat et al. (2016) comentaron que los diseños genéticos que más frecuentemente se han usado en las últimas décadas son la cruza dialélica, el diseño factorial de Carolina del Norte (método II) y la cruza línea x probador (mestizos). En éstos se han discutido los resultados con base en la estimación de los efectos y varianzas de aptitud combinatoria general y específica en cultivos como trigo, cártamo (Carthamus tinctorius L.), arroz (Oriza sativa L.), sorgo (Sorghum bicolor (L) Moench), alfalfa (Medicago sativa L.), chile (Capsicum annum L.), chícharo de vaca (Vigna unguiculata L.), jitomate (Solanum lycopersicum L.), ajonjolí (Sesamum indicum L.) y linaza (Linum usitatissimum L.), entre otros.
La evaluación de las progenies de una cruza dialélica en varios años y localidades usando un diseño y un análisis genético-estadístico apropiado podría ser compleja, pero esencial, para determinar su estructura genética, ambiental y de interacción genotipo-ambiente, su contribución en la estimación de los efectos y varianzas de aptitud combinatoria, heterosis, heredabilidad, respuesta a la selección y predicción de híbridos sobresalientes (Sahagún, 1990; González et al., 2007a, b; Harriman y Nwammadu, 2016; Fasahat et al., 2016; Awata et al., 2018).
Los componentes de varianza genética estimada por medio de los diseños de apareamiento se pueden igualar con las covarianzas entre parientes. Las únicas suposiciones necesarias son que los progenitores sean miembros aleatorios de la población genética y que los errores experimentales sean independientes. Las correlaciones ambientales se evitan aleatorizando las progenies; una varianza negativa puede atribuirse a una desviación causada por el tipo de muestreo y por el tamaño de la muestra (Dudley y Moll, 1969).
La técnica del análisis de varianza (Anava) se usa para dividir la variabilidad estimada en uno o más experimentos en diferentes componentes según el modelo genético-estadístico aplicado a variables cuantitativas. También se emplea en rasgos cualitativos después de transformar los datos originales para que éstos cumplan con las suposiciones de que los efectos genotípicos y ambientales sean aditivos, y que los errores experimentales o residuales de los modelos, se distribuyan normal e independientemente con una varianza común (Sahagún, 1990; Sahagún, 1998). Si las diferencias entre genotipos son significativas (p≤ 0.05) se realiza el análisis dialélico, con alguna de las metodologías consideradas en este o en otros estudios (Griffing, 1956b; Shattuck et al., 1993; González et al., 2007a, b; Pérez et al., 2020).
González et al. (2007b); Pérez et al. (2020) dividieron la variabilidad de un dialélico completo formado con líneas endogámicas de maíz en sumas de cuadrados parciales y contrastes mutuamente ortogonales para probar las hipótesis sobre progenitores (P), cruzas directas (CD), cruzas recíprocas (CR), P versus CD y CD versus CR, cuando sus efectos fueron significativos se aplicó el método 1 de Griffing (1956b), como lo sugirieron Shattuck et al. (1993). El primer contraste calcula heterosis promedio, también estimable en el Anava con el método de Gardner y Eberhart (1966), pero con ninguno de Griffing (1956b) y el segundo contraste calcula indirectamente efectos maternos y recíprocos, también estimables con el Anava con los métodos 1 y 3 de Griffing (1956b).
Singh (1973a, b) desarrolló los procedimientos estadísticos para el análisis de datos de una cruza dialélica en varios ambientes, pero Zhang y Kang (1997); Zhang et al. (2005) mostraron como estimar efectos recíprocos usando SAS con énfasis en su partición en efectos maternos y no maternos en series de experimentos, como lo sugerió Cockerham (1963). Ellos comentaron que este tipo de partición permite saber si los efectos maternos o los factores extranucleares están involucrados en la expresión de un rasgo fenotípico.
Kearsey (1965) derivó familias de la misma población usando cruzas entre dos progenitores, diseños I y II de Carolina del norte, dialélico medio de Hayman (1954) y dialélico parcial de Kempthorne y Curnow (1961). La única restricción fue que para la estimación de los componentes de varianza el número de cruzas en cada metodología, incluyendo las autofecundaciones, fuera igual o cercano a 45. Se concluyó que el método de Hayman y Jinks (1954) proporciona más información que cualquier otro diseño, pero requiere que se cumplan un mayor número de suposiciones genéticas. Baker (1978) agrupó los métodos II y III de Gardner y Eberhart (1966), 2 y 4 de Griffing (1956b) y el de Hayman (1954) para discutir los problemas que surgen en un análisis dialélico, desde el punto de vista estadístico existen controversias críticas sobre la elección de un modelo de efectos genotípicos fijo y aleatorio y desde el punto de vista genético, las suposiciones sobre la distribución independiente de los genes en los progenitores es difícil de satisfacer y la hipótesis de ausencia de epistasis y de ligamiento de genes también puede ser incorrecta.
Los métodos de Griffing (1956b) se han preferido sobre los de Hayman y Jinks y los de Gardner y Eberhart (1966) debido a que no están condicionados por suposiciones genéticas. Además, el análisis, si no se dispone de software especializado, es más complejo en las dos últimas. Los métodos de Griffing (1956b) y de Gardner y Eberhart (1966) pueden aplicarse en especies autógamas y alógamas, incluso poliploides como la papa (Solanum tuberosum L.) y los de Hayman y Jinks (1954) están restringidos a progenitores homocigóticos o endogámicos (Baker, 1978; Christie y Shattuck, 1992; Awata et al., 2018). Christie y Shattuck (1992) comentaron que los análisis de Gardner y Eberhart (1966) son similares a los de Hayman (1954a, b) y a uno de Griffing (1956 b). En Zhang y Kang (1997) se analizan otras similitudes y diferencias que existen entre los cuatro métodos de Griffing.
La principal limitante que muestran las metodologías de Griffing (1956a, b) tiene que ver con el número de progenitores elegido: con cuatro padres hay tres grados de libertad que no permiten estimar con confiabilidad la hipótesis para ACG y con 20 de ellos habrá mayor precisión en su estimación, pero se generará un ensayo inmanejable (400 cruzamientos) si se elige el método 1, independientemente de la aplicación del modelo I o II (González et al., 2007a, b; Awata et al., 2018; González et al., 2020; Pérez et al., 2020). Christie y Shattuck (1992) comentaron que en la mayoría de los experimentos dialélicos que revisaron se incluyeron entre 6 y 10 progenitores.
Utilizar un mayor número de padres permitirá obtener información más confiable, pero su número óptimo deberá ser tal que permita justificar la información adicional que se obtenga y es necesario definir con anticipación a la población de referencia. Cuando los progenitores fueron considerados como una muestra de una población ancestral fueron sugeridos entre 17 y 19 padres o entre tres y cinco ensayos con ocho de ellos cada uno (Hayward, 1979). En las investigaciones que fueron consideradas en el presente estudio se observó que el número de progenitores para los métodos 1, 2, 3 y 4 de Griffing (1956b) varió de 4 a 12, 5 a 12, 7 a 13, y 4 a 16, respectivamente. Fasahat et al. (2016) reportaron que para el dialélico el número de progenitores ensayado varió de 4 a 15 y para el dialélico medio osciló de 5 a 12.
Griffing (1956b) discutió ocho análisis que se originan al combinar sus cuatro métodos con las dos suposiciones que se hacen con relación a la naturaleza de muestreo del material experimental (modelos I y II). Shattuck et al. (1993) destacaron que son 16 análisis posibles, si además de lo anterior, se incluyen los modelos mixtos A y B. En la realidad habría más combinaciones si se consideran las series de experimentos en tiempo y espacio o los arreglos de parcelas divididas ensayados bajo los diseños experimentales completamente al azar, bloques completos al azar o algún látice (Gomez y Gomez, 1984; Sahagún, 1998; Moore y Dixon, 2014; Pérez et al., 2019).
La elección de alguna de las metodologías de Griffing (1956b) depende del tipo de material experimental considerado y de los objetivos de la investigación. Cuando sólo son del interés las cruzas F1 es más apropiada la aplicación de los métodos 3 y 4 para estimar los efectos (modelo I) o las varianzas (modelo II) de ACG y ACE. Si hay duda con relación a la presencia de genes ligados al sexo o de efectos maternos el método 3 es el más adecuado. Si el objetivo principal es identificar líneas sobresalientes que serán utilizadas en la formación de una variedad sintética los progenitores deberán incluirse en el experimento y se emplearán los métodos 1 o 2 para su análisis genético-estadístico (Griffing, 1956b; Baker, 1978; Christie y Shattuck, 1992; Shattuck et al., 1993; González et al., 2007a, b).
La ACG está relacionada con efectos génicos aditivos y la ACE con dominancia o epistasis (Sprague y Tatum, 1942; Dudley y Moll, 1969; Baker, 1978; Christie y Shattuck, 1992; Awata et al., 2018). En las diferentes técnicas de selección son más importantes los efectos de aditividad y en los programas por hibridación son esenciales los efectos no aditivos (Borojevic, 1990; Mumtaz et al., 2015; Harriman y Nwammadu, 2016; Awata et al., 2018). Con relación a la predicción de híbridos F1, Dudley y Moll (1969) puntualizaron que sólo se justifica cuando la proporción de la varianza de dominancia sobre la varianza aditiva se encuentre en el rango de sobredominancia o cuando se obtengan estimaciones de la varianza epistática que incluya varianza de dominancia. Ellos no recomiendan el uso de algún tipo de diseño en látice debido que éstos se confunden con las medias de diferencias genéticas y ambientales, por lo que éstos no son satisfactorios.
En especies de polinización libre (plantas alógamas), cuando la autofecundación origina depresión endogámica que causa alta mortandad de plantas, como sucede frecuentemente en la alfalfa (Medicago sativa L.), los estudios de aptitud combinatoria general y específica podrían estar restringidos al uso de progenitores no endogámicos o parcialmente endogámicos, con una sola generación de autofecundación; si F, el coeficiente de endogamia, es igual o menor a 0.75, la cruza dialélica no es recomendable. En esta última situación y cuando el objetivo sea estimar efectos de ACG, los métodos de policruza, línea x probador y dialélico parcial podrían ser los más apropiados (Griffing, 1956b; Christie y Shattuck, 1992; Shattuck et al., 1993; González et al., 2007a).
En tomate de cáscara (Physalis ixocarpa Brot. ex Horm.) existe incompatibilidad gametofítica causada por dos genes independientes con alelos múltiples que impiden la formación de líneas altamente endogámicas e híbridos usando técnicas de fitomejoramiento convencionales (Mulato et al., 2020) por lo que, con esta restricción biológica, sería más recomendable aplicar alguna técnica de selección (Peña y Márquez, 1990), practicar hibridación intervarietal con familias de medios hermanos maternos (Peña et al., 1999) o realizar cruzas planta a planta (Santiaguillo et al., 2004).
Ningún método de Griffing (1956b) considera epistasis y ligamiento; para su estimación debe usarse uno de éstos junto con la metodología de Hayman (1954) o si el objetivo fuera también estimar heterosis, ambas técnicas junto con la de Gardner y Eberhart (1966), aun cuando incrementarían los costos y el tiempo destinado a la evaluación de un grupo de cruzas dialélicas, serían las más deseables para realizar una evaluación integral (Hallauer et al., 2010; Muntaz et al., 2015; Awata et al., 2018; Pérez et al., 2020).
Para SAS se han diseñado los códigos y programas para las metodologías de Griffing (1956 b), Hayman (1954) y Gardner y Eberhart (1966), entre otros, para analizar datos con los diseños experimentales completamente al azar, bloques completos al azar y algún látice en uno o más factores (Martínez, 1988; Kang y Zhang, 1977; Zhang et al., 2005; Makumbi et al. (2018), si no se dispone de recursos para adquirir una licencia comercial, podría descargarse una versión académica de prueba, con vigencia hasta por un año.
AGD-R, PBTools y Genes también son buenas opciones; éstas se pueden descargar gratuitamente de los portales electrónicos del Centro Internacional de Mejoramiento de Maíz y Trigo (CIMMYT; Rodríguez et al., 2018), del Instituto Internacional de Investigación en Arroz (IRRI, 2014) y de la Universidad Federal de Vicosa (Brasil; Cruz, 2013), respectivamente. Agrobase e Indostat sólo pueden utilizarse con licencia comercial, pero ambos son más amigables que los softwares anteriores. Tnaustat y OPStat, disponibles gratuitamente en sus portales electrónicos, sólo analizan experimentos para un ambiente (año o localidad). En Mastache et al. (1999 a, b); Mastache y Martínez (2003); Sestras et al. (2018); González et al. (2020) se consideran códigos, programas y algoritmos para el análisis de Griffing con SAS u otro software.
Conclusiones
La elección de progenitores adecuados y de un buen diseño de apareamiento y experimental son las claves para lograr un esquema exitoso de mejoramiento. Desde un punto de vista estadístico la parte critica del uso de los diseños dialélicos sería la elección de un modelo de efectos fijos o aleatorios, desde el punto de vista genético, para interpretar los resultados, la suposición de la distribución independiente de los genes en los progenitores no es muy aceptable en la práctica, el segundo supuesto, la ausencia de epistasis y de ligamiento entre genes, es a veces también incorrecto. La epistasis afecta la estimación de las varianzas de ACG y ACE. Como alternativa a la interpretación genética de los resultados, la descripción estadística del análisis dialélico puede ser usada para contestar preguntas concernientes a la importancia de la ACE y la predictibilidad del comportamiento de los híbridos usando ACG o el comportamiento de los progenitores.