Análisis comparativos de distribuciones de longitud del genoma viral y de plantas mediante estadísticas generalizadas.
Esta tesis doctoral explora el análisis estadístico de las distribuciones de longitud de los genomas virales y de plantas, buscando comprender los patrones y correlaciones estadísticas subyacentes. Proponemos una amplia gama de modelos derivados de las estadísticas generalizadas de Tsallis y Kaniadakis: $q-$exponencial, suma de $q-$exponenciales, $q-$Gaussiano, $q-$Weibull, $\kappa-$exponencial, suma de $\kappa-$exponenciales y $\kappa-$Maxwellianos. Utilizamos la inferencia bayesiana y los criterios AIC y BIC para identificar los modelos que mejor explican el comportamiento de las secuencias genéticas analizadas. Inicialmente, estudiamos las distribuciones de longitudes asociadas con intrones y exones de dos especies de plantas pertenecientes a la familia \textit{Cucurbitaceae}, a saber, \textit{Cucumis sativus y Cucumis melo}. En este caso, probamos los ajustes para las funciones $q-$exponenciales y la suma de $q-$exponenciales, donde esta última resultó ser superior. Los valores encontrados para el índice entrópico $q$, para todos los cromosomas de ambas especies, fueron 1,28 $\pm$ 0,06 para los intrones y 1,06 $\pm$ 0,13 para los exones. Ampliamos esta investigación en el contexto de las estadísticas de Kaniadakis, utilizando tres especies de cucurbitáceas más: \textit{Cucurbita maxima}, \textit{Cucurbita moschata} y \textit{Cucurbita pepo}. Se probaron los modelos $\kappa-$exponenciales, suma de $\kappa-$exponenciales y $\kappa-$Maxwellianos y la suma de $\kappa-$exponenciales demostró ser superior a los demás, considerando las secuencias de exones y intrones. Los valores del índice entrópico $\kappa$ para las especies analizadas se encuentran dentro del rango $(0.35 \pm 0.08)$. Ampliamos la base de datos a 23 especies de plantas pertenecientes a 7 familias diferentes y probamos la viabilidad de los modelos propuestos para explicar las distribuciones de longitud de las proteínas vegetales. Las funciones $q-$Gaussianas y $\kappa-$Maxwellianas fueron superiores y presentaron valores de $q$ y $\kappa$ en el mismo rango para todas las especies investigadas: $q_g$ = 1.28(4) y $\ kappa$ = 0,38(4). Estas funciones también demostraron ser eficientes para explicar el comportamiento de las distribuciones de longitud de proteínas de 25 especies virales, pertenecientes a las familias \textit{Flaviviridae} y \textit{Coronaviridae}. Identificamos la posible existencia de información biológica, presente en cadenas de ADN, capaz de caracterizar plantas y virus.