73 Matching Annotations
  1. May 2022
  2. Apr 2022
    1. ¿Qué es la Gestión de Datos de Investigación?

      Mantra un curso online: https://mantra.ed.ac.uk/

    2. ste concepto incluye, no tan solo los resultados de las investigaciones que se publican, si no también, implica a los datos de investigación, software o códigos, flujos de trabajo, ciencia ciudadana, recursos educativos y métodos de evaluación científica.

      Abrir las metodologías.

  3. Mar 2022
    1. Marcelo Raimundo
    2. CRAN

      https://cran.r-project.org/ 2.10 What is CRAN? The “Comprehensive R Archive Network” (CRAN) is a collection of sites which carry identical material, consisting of the R distribution(s), the contributed extensions, documentation for R, and binaries.

      The CRAN master site at WU (Wirtschaftsuniversität Wien) in Austria can be found at the URL

      https://CRAN.R-project.org/

      and is mirrored daily to many sites around the world. See https://CRAN.R-project.org/mirrors.html for a complete list of mirrors. Please use the CRAN site closest to you to reduce network load.

      From CRAN, you can obtain the latest official release of R, daily snapshots of R (copies of the current source trees), as gzipped and bzipped tar files, a wealth of additional contributed code, as well as prebuilt binaries for various operating systems (Linux, Mac OS Classic, macOS, and MS Windows). CRAN also provides access to documentation on R, existing mailing lists and the R Bug Tracking system.

      Since March 2016, “old” material is made available from a central CRAN archive server (https://CRAN-archive.R-project.org/).

      Please always use the URL of the master site when referring to CRAN.

    3. paquete purrr

      Purrrr

    4. Quien se propone hacer un análisis histórico cuantitativo debe partir de un ejercicio de codificación de las fuentes documentales que el pasado nos ha legado y plasmarlas en una matriz de datos

      Metodología: hacer de los datos, datos inteligentes. Smart Data: http://journalofdigitalhumanities.org/2-3/big-smart-clean-messy-data-in-the-humanities/

    5. análisis exploratorios

      El análisis exploratorio de los datos se refiere al conjunto de técnicas estadísticas cuyo objetivo es explorar, describir y resumir la naturaleza de los datos y comprender las relaciones existentes entre las variables de interés, maximizando la comprensión del conjunto de datos. Independientemente de la composición de los datos y de los análisis estadísticos que se realicen posteriormente, un análisis exploratorio de datos posee importantes ventajas: una exploración minuciosa de los datos permite identificar posibles errores (datos incorrectamente introducidos, detectar la ausencia de valores o una mala codificación de las variables), revelar la presencia de valores atípicos (outliers), comprobar la relación entre variables (correlaciones) y su posible redundancia o realizar un análisis descriptivo de los datos mediante representaciones gráficas y resúmenes de los aspectos más significativos. https://datos.gob.es/sites/default/files/doc/file/analisis_exploratorio_de_datos_2021_v6.pdf

    6. Los datos representan los valores de ciertas variables de análisis comunes a todos los registros, como son la ciudad (dónde) y la fecha del atentado (cuándo). Desde la información descriptiva de la policía (atributos del atentado), fue posible generar variables como: objeto utilizado en el atentado (con qué elemento se realizó), sitio (lugar/espacio) y objetivo (contra quién)

      Datos construidos

    7. archivo de la ex Dirección de Inteligencia de la Policía de Buenos Aires (Argentina)
    8. Resistencia peronista”
    9. kableExtra8.

      Desde Linux distribuciones de debian, es posible que salga el error: Warning in install.packages : installation of package ‘kableExtra’ had non-zero exit status. Al parecer se requiere hacer configuraciones para las dependencias. Por lo tanto se debe correr la siguiente línea: You are missing a system dependency, install it from a terminal sudo apt install libfontconfig1-dev

    10. tibble.

      Tibble es un desarrollo propio de tidyverse.

    11. Además, R cuenta con una forma particular de estructura de datos, la cual tiene dos dimensiones y nos da la posibilidad de contener datos de distinto tipo (enteros junto a fechas, caracteres, etcétera). Esta estructura es denominada data frame, y se compone por filas y columnas; cada fila corresponde a una observación o registro, mientras que cada columna es un vector que representa una variable de análisis. El data frame es una de las estructuras más utilizadas en R y los datos que importamos de hojas de cálculo se almacenarán de esta manera.

      En Python no existía este tipo estructuración de datos y por eso está la biblioteca de Pandas.

    12. vector

      Un vector es en Python una lista de datos.

    13. at59 <-

      at59 es un nombre de un objeto. Podria llamarse de cualquier manera. <- es la manera como se asigna.

    14. Si no estuviese en tu directorio de trabajo, deberás indicar toda la ruta del archivo

      Absolute path is the full path. So, on Unix systems, that will be starting from root directory, and windows, starting from the main drive (C, D, etc)

      If you are on Mac, try something like this ~/Desktop/StudentRevertantFrequencies.xlsx. Or, go to finder and note the path via right click and get info for file.

      If you are on windows, you can get the path via Properties after right click on the file.

      https://community.rstudio.com/t/path-does-not-exist/62989/2

    15. Es decir, esto demanda un proceso de conversión de nuestras fuentes de información, para transformar los datos textuales (palabras) en datos simbólicos operables digitalmente (números). Lo anterior consta de varios pasos: 1) clasificar los documentos a los que se ha accedido de forma que permitan su puesta en común según criterios determinados, 2) categorizar descriptiva, interpretativa o analíticamente, con ideas, categorías o conceptos el contenido de las fuentes, 3) codificar, poniendo a las distintas expresiones particulares de cada caso un símbolo (números, palabras), 4) tabular, es decir, representar los casos organizados en forma de una matriz en un soporte informático, habitualmente una hoja de cálculo.

      Metodología

  4. Feb 2022
    1. Esta estructura, además, estaba anclada en un paralelismo con el mundo físico: los directorios eran cajones o carpetas, y en una carpeta podías guardar documentos o también otras carpetas. La iconografía utilizada reflejaba esto perfectamente, y lo pudimos ver cuando los sistemas operativos comenzaron a hacerse gráficos: el icono del administrador de archivos era un archivador de oficina con sus cajones, y las carpetas eran las muy habituales carpetas amarillas de cartón. Si querías localizar un documento, simplemente navegabas – al principio con comandos, después con clics de ratón – en la estructura de carpetas y subcarpetas que habías creado.
    1. Free software,

      En español se habla de s libre y gratuito

  5. Dec 2021
  6. filosdist.uaz.edu.mx filosdist.uaz.edu.mx
    1. destinatario de lo que formulamos esel estudiante. Por lo tanto, es preciso que los objetivos sean claros, evaluables, rele-vantes y significativos para él, y que estén redactados desde su punto de vista. De otromodo, el estudiante no sabría qué se espera de él y los objetivos no podrían cumplir sufunción como recurso de aprendizaje

      Hacer objetivos pensando en los estudiantes. Si yo soy el estudiante puedo leer y saber qué se espera que aprenda.

    1. los usuarios jóvenes carecen de estructura mental alguna a la hora de organizar sus ficheros y sus

      ¿Están de acuerdo con esta afirmación?

  7. Nov 2021
  8. Oct 2021
    1. Su nombre significa “el del pie hecho bola”, torcido, y es así como se le representa.

      Xólotl el gemelo de Quetzalcóatl tenía el pie torcido.

    2. Tezcatlipoca

      TExcaltiploca no tenía un pie.

  9. Sep 2021
    1. ¿Qué hace la estética stroke? ¿Con qué formas trabaja? (Pista: consulta ?geom_point)
    2. Asigna una variable continua a color, size, y shape. ¿Cómo se comportan estas estéticas de manera diferente para variables categóricas y variables continuas?

      Pregunta para el grupo! Mostrar ejemplos.

    3. También puedes fijar las propiedades estéticas de tu geom manualmente

      ¿Cuántas maneras hay para asignar color a un gráfico? ¿En qué se diferencian?

    4. diagrama de dispersión (o scatterplot).
    5. ggplot(data = millas) + geom_point(mapping = aes(x = cilindrada, y = autopista))

      Tuve problemas con ggplot y esta línea no se pudo ejecutar. Este es el error que me salió: Error: package or namespace load failed for ‘ggplot2’ in get(method, envir = home): lazy-load database '/Library/Frameworks/R.framework/Versions/4.1/Resources/library/ggplot2/R/ggplot2.rdb' is corrupt

    6. ?millas.

      Se debe incluir una interrogación más para poder hacer la consulta de este data frame.

    7. http://vita.had.co.nz/papers/layered-grammar.pdf.

      Vale la pena leerlo!

    8. ggplot2

      ggplot es un paquete creado por el autor de este libro. Hadley Wickham. https://en.wikipedia.org/wiki/Hadley_Wickham Profesor de estadística y desarrollador de varios paquetes de R. ¡Wow!

    1. Qué otro(s) comando(s) podría(n) agregarse a estos en un pipeline para encontrar qué animales contiene el archivo (sin nombres duplicados)?

      Aveces la terminal se queda hacieno un proceso y salen símbolos como este ^[[A^[[A^C en eso caso debes dar c control + c

    2. $ cd north-pacific-gyre/2012-07-03

      En caso de que teclees y no llegues a este archivo debes saber primero donde estás. Para eso escribe pwd. Esto te indicará en que directorio estás y navega o ve con la ruta relativa al archivo.

    1. Observa que hay dos significados para el carácter
    2. Nelle nombra sus directorios “año-mes-día”, con ceros a la cabeza para meses y días, porque la terminal muestra los nombres de archivos y directorios en orden alfabético. Si usara nombres de mes, diciembre vendría antes de julio; si no utiliza ceros a la izquierda, Noviembre (‘11’) vendría antes de julio (‘7’). Del mismo modo, poner el año primero significa que junio de 2012 aparecerá antes de junio de 2013.

      Calve para el nombramiento.

    3. ls --help

      A mi en mi terminal iterm2 me funcionó el comando

      man ls

      Con este comando puedo ver la documentación de cada comando.

    4. username

      Los usuarios del sistema Super usuario y usuarios. ¿Cómo explicarlo?

    5. PS1='$ '

      Comando para dejar el prompt en una sola línea. ¡Wow!

    1. similares a las de Unix para Windows.

      Para windows está https://cygwin.com/install.html Hay que probarla.

      Comandos según sistema operativo:https://ss64.com/osx/installer.html

    2. Doug Engelbart’s en los 60s, el cual podemos ver en lo que se ha denominado “La Madre de todos los Demos”.
    1. Si no encuentras nada útil, prepara un ejemplo reproducible o reprex. Un buen reprex hace más fácil que otras personas te puedan ayudar y al prepararlo probablemente resuelvas el problema por tu cuenta.

      ¿Cómo hacer un reprex para buscar ayuda?

    2. Si el error te aparece en español u otro idioma, ejecuta en la consola Sys.setenv(LANGUAGE = "en") y luego vuelve a ejecutar el código. Es más probable que encuentres ayuda si el error que arroja R está en inglés.

      Capturar los errores en inglés nos permite poder buscar las respuestas en un universo más amplio.

    3. Una vez al año sale una nueva versión importante de R y hay entre 2 y 3 ediciones menores en ese período. Es una buena idea actualizarlo regularmente. El proceso puede ser un poco engorroso, especialmente en el caso de las versiones mayores, que requieren que reinstales todos los paquetes que ya tienes. Sin embargo, no hacerlo puede ser peor. Para este libro, asegúrate de tener al menos la versión 3.5.

      El ecosistema digital requiere de cuidados. Si pensamos en una milpa, chagra o huerto, sabemos que los alimentos no crecen por sí solos, sino que son el resultado de las asociaciones entre plantas, tierra, insectos y además los cuidados que muchas personas tienen con todo este entorno. De manera similar ocurre con el software. Cada tiempo se requiere de "deshierbe" "Abono", " descanso" para que un software o algunas "extensiones" funciones correctamente en las condiciones siempre cambiantes. De ahí que detrás de un software estén personas revisando los errores "bugs" los nuevos requerimientos de usuarios o de las infraestructuras. Dependiendo de las capacidades de las máquinas, los sistemas operativos y sus versiones trabajamos con una u otra versión de un software. Aveces ocurre que hay paquetes que ya no sirven con nuevas actualizaciones o que nuevos paquetes no funciones en versiones antiguas.

    4. RStudio es un ambiente de desarrollo integrado

      Los ambientes de desarrollo integrado son interfaces que nos permiten tener un desempeño más intuitivo con una herramienta. Ya no se trabaja desde la terminal de la computadora sino desde una interfaz. En términos didácticos reduce la curva del aprendizaje. En todo caso es importante comprender cómo funcionan los flujos entre la máquina y el software de desarrollo.

  10. Aug 2021
    1. Las personas que lleven a cabo la recolección y almacenamiento de datos personales, que sea para uso exclusivamente personal, y sin fines de divulgación o utilización comercial

      Si se hace uso personal no aplica la ley!

    1. Especifique como se puede acceder a los datos si hay alguna restricció

      Anonimización

    2. Especifique donde se depositarán los datos, los metadatos asociados, la documentación y el software

      Escoger un repositorio abierto de datos.

    3. Describa las convenciones usadas para la nomenclatura

      Solicitar estándares mínimos de CID

    4. Indique el tamaño esperado de los datos (si se conoce)

      ¿Cómo anticiparse a este dato?

    5. Indique los formatos y tipos de los datos generados/recolectados

      Apartado Arien 1 día.

    1. A qué nos referimos con estudios de observación "puros": Son de acción humana y se producen en un foro abierto al público general Son no invasivos No requieren de la interacción con los participantes No identifican a los participantes

      Big Data

    1. “Maniesto de ciencia abierta y colaborativa: hacia una ciencia abierta e inclusiva por el bienestar social y ambiental” promovido por la Red de Ciencia Abierta y Colaborativa para el Desarrollo (OCSDNet).
  11. Jul 2021
    1. There is a magic in information graphics. Maps float you above the land for a bird’s eye view. Timelines arrange memories on the page for all to see. Diagrams reveal the parts inside without requiring disassembly, or incision.*

      Exposición de la universidad de Standford sobre visualización.

  12. May 2021
    1. La escritura en pads

      ¿Cómo haces para tener una llave de cada pad? ¿De qué manera se podrían traerlos metadatos de un pad?

    2. ¿Qué son las recetas?

      "Las recetas es una secuencia de comandos pensada para un salida (output) pero que al mismo tiempo que indica como se produce, se describe y se explica. La receta parte de un pad en markdown donde se puede ejecutar y escribir"

  13. Apr 2021
    1. Un recipe sería una receta que funciona de input como una secuencia de comandos para outputs, la descripción de su funcionamiento e incluso reflexiones en torno a su ejecución.

      De nuevo, dar un ejemplo. ¿La receta sería un conjunto de scripts?

    2. Con un punto de partida en la Wikipedia, un script es un guion de secuencia de comandos que apartir de datos de entrada (inputs) produce datos de salida (outputs).

      Estaría bien dar un ejemplo. Por ejemplo existen diversos script para trabajar alistar corpus: normalizar cadenas de texto a minúsculas, quitar caracteres o espacios no deseados, extraer cierto tipo de palabras. Con una sola línea de comandos es posible realizar esta tarea.

    3. En esta «receta» se hará un programa-documento que entre los documentos producidos también usará este texto para procesarlo y así producir un texto que fue programado para publicarse con distinto contenido.

      ¿Cómo se puede decir esto de otra manera?

    4. macro

      En ciencias de la computación, macro (del griego μακρο, makro, que significa ‘grande’) ―abreviatura de macroinstrucción― es una serie de instrucciones que se almacenan para que se puedan ejecutar de manera secuencial mediante una sola llamada u orden de ejecución. Extracto de el enlace de wiki.

  14. Apr 2020
    1. nuestro pensamiento, que es por definición no lineal y funciona por un método deasociación semejante a la estructura del hipertexto, y de cómo la tecnología de la prensa yla alfabetización lingüística nos obligue de alguna manera, a condicionar nuestra forma depensar

      ¿Es nuestro cerebro hipertextual?