35 Matching Annotations
  1. Last 7 days
  2. Mar 2026
    1. 2. Libro de códigos y descriptivos univariados

      Sugiero simplificar eligiendo las tablas que resumen los datos centrales de la base de datos

      Sugiero agregar un gráfico: tal vez alguno que reproduce los resultados presentados antes

    1. En esta etapa, por ejemplo, Salud pasó de 969 a 909 registros, eliminando grupos duplicados que habrían afectado el conteo final.

      Mostrar un ejemplo de registros duplicados. En esto debe quedar muy claro el paso a paso.

    2. Del mismo modo, los residuos no binarios que no podían interpretarse de manera defendible como presencia o ausencia fueron preservados como NA.

      Ejemplo, ¿en cuantos casos ocurre?

    3. Después de esta etapa, los vacíos en documento quedaron resueltos y los vacíos en cita fueron eliminados de la base operativa.

      Explicar muy claro el resultado de esta etapa. Tal vez dar un ejemplo.

    4. El siguiente problema apareció en relación con artefactos visuales heredados de los archivos de origen, especialmente celdas combinadas y filas sin contenido analítico.

      Propongo:

      El siguiente problema que se observa son celdas combinadas y filas sin contenido analítico.

    5. se observaban duplicados de row_id en varios módulos, incluyendo Salud, HSE, DDHH y EDS, y presencia de cita vacía en módulos como PAZ y HSE.

      Dar ejemplos de las filas en que esto ocurre y como se ve en el archivo original

    6. Esto significa que la consolidación no fue entendida como una intervención destinada a modificar la información, sino como un proceso de estandarización, explicitación de reglas y validación de consistencia.

      Plantearlo en postivo:

      Esto significa que la consolidación fue entendida como un proceso de estandarización, explicitación de reglas y validación de consistencia, manteniendo información original.

    7. La heterogeneidad del corpus no era un problema meramente estético o de formato.

      Propongo: El corpus orginal presenta una alta heterogeneidad entre archivos. En la práctica,...

    8. Desde el punto de vista analítico, mantener los insumos tal como estaban implicaba varios riesgos

      Desde el punto de vista analítico, mantener los insumos originales implicaba una serie de consecuencias. Primero, sobreconteo o subconteo: si existían duplicados no resueltos o filas separadoras tratadas como observaciones reales, los descriptivos y frecuencias podían distorsionarse. Segundo, pérdida de trazabilidad: si no existía una llave operativa estable para seguir cada registro a través de las distintas transformaciones, se debilitaba la posibilidad de auditar el proceso completo. Tercero, la posibilidad de comparación inválida: si los indicadores no compartían un dominio común o si columnas análogas estaban definidas de forma distinta entre módulos, cualquier intento de producir síntesis comparables podía volverse metodológicamente frágil. Finalmente, opacidad: incluso si el procesamiento lograba “funcionar”, sin documentación explícita de las decisiones sería difícil defender por qué determinadas reglas fueron aplicadas y otras descartadas.

    9. La relevancia de esta etapa deriva de una premisa básica del trabajo cuantitativo: los análisis sólo son tan confiables como la base sobre la cual descansan. Cuando los datos provienen de múltiples archivos, hojas, módulos y convenciones de codificación, la producción de una base consolidada deja de ser una tarea secundaria y pasa a ser una condición de posibilidad del análisis mismo. En ese contexto, e

      Me parece que esto no debería ir aquí. Propongo iniciar este párrafo en:

      El objetivo de esta entrega fue construir la infraestructura metodológica que permitirá producirlas de manera válida en los siguientes etapas.

    1. En síntesis, al comienzo existía la misma información que al final, pero dispersa, heterogénea y en una forma que no permitía confiar plenamente en su uso analítico. Al cierre de la entrega M1, esa misma información quedó organizada, alineada, documentada y verificada. La importancia de esta transformación radica en haber dejado en una forma segura los datos para producir análisis regionales y nacionales defendibles en las fases siguientes del proyecto.

      Propongo:

      En síntesis, el resultado final de esta entrega consolida los arhivos originales en un archivo único organizado, documentado y verificado. La importancia de esta transformación radica en haber dejado en una forma segura los datos para producir análisis regionales y nacionales trazables en las fases siguientes del proyecto.

    2. A ello se suma que la base final no presenta duplicados globales ni de row_uid ni de row_id, que no registra faltantes globales en los campos esenciales module, pais, documento y cita, y que los indicadores quedaron contenidos dentro del dominio esperado, sin valores inválidos fuera de {0,1,NA}.

      Para hablar de estos códigos se deberían anticipar o dejar esta parte de la explicación para el texto extendido y no aquí en el resumen ejecutivo. Propongo sacar esta parte del resumen. Este párrafo inciaría en: En materia de completitud...

    3. La base master constituye el insumo principal para el análisis cuantitativo, mientras que la tabla notes se mantuvo como una estructura auxiliar alineada registro a registro. Esta correspondencia uno a uno asegura que, cuando existe información textual o complementaria asociada a una observación, ésta pueda vincularse sin desalineación con la fila analítica correspondiente. No obstante, dado que notes no contiene contenido sustantivo en todos los casos, su valor en esta etapa radica principalmente en la conservación ordenada de esa estructura paralela, más que en aportar evidencia cualitativa completa para cada registro.

      Esta explicación no es necesaria. Dejaría sólo:

      El resultado final fue una base maestra de 7.410 filas, que corresponde al número de citas disponibles en los once modulos temáticos. La base consolidada tiene una unidad de análisis explícita: cada fila corresponde a una evidencia o cita curricular específica ubicada en un documento, módulo y página determinados, organizando la evidencia curricular bajo una estructura común. Sobre esa unidad de análisis se articulan variables núcleo, variables de trazabilidad e indicadores recodificados.

    4. El proceso consideró el congelamiento de insumos y la validación del inventario de fuentes; luego, la construcción de mappings por módulo para que estructuras originalmente heterogéneas pudieran traducirse a una estructura canónica común. A partir de ello, se armó una base compartida, se corrigieron artefactos heredados del formato de origen, se separó la información según su función en variables núcleo, indicadores y notas, se recodificaron los indicadores a un dominio comparable, se eliminaron duplicados de manera trazable, se consolidó todo en una base maestra y, finalmente, se ejecutaron controles de calidad en cada etapa.

      Este texto tiene muchos conceptos que pueden ser díficiles sin estar familiarizado (artefactos heredados, función en variables núcleo, estructura canónica). Propongo dejar sólo la siguiente parte (En términos simples..), que simplifica en lenguaje coloquial estos pasos.

    5. En otras palabras, la información necesaria para el análisis ya existía, pero no estaba en una forma que permitiera utilizarla sin riesgo. Analizar ese material tal como se encontraba habría expuesto el proceso a errores de conteo, pérdida de trazabilidad entre registros, confusión entre columnas equivalentes y comparaciones inválidas entre módulos.

      Propongo la siguiente reformulación:

      Con la finalidad de armonizar la información en un set de datos que facilite la trazabilidad de registros, el conteo y las comparaciones, se desarrolló uan serie de procedimientos.

    6. Consolidación y validación de la base ESD/GCE

      Muchas gracias por el reporte. Me parece que está muy bueno el avance. A continuación dejo comentarios para mejorar esta entrega.

      Como comentario transversal: el tono que describe los insumos, a ratos es muy crítico de la calidad de los documentos previos. Me parece que hay que suavizar eso.

      En algunos casos sugiero agregar ejemplos qe ayuden a clarificar lo que propone. Porm ejemplo, cuando se habla citas duplicadas, dar un ejemplo de citas duplicadas en las filas n°xx y n°xx del documento nn. Mostrar que son lo mismo, y por tanto, se cuenta dos veces. Con eso podemos justificar la elección de una de ella.