3,419 Matching Annotations
  1. Last 7 days
    1. Fingerprint is a general purpose data integrity tool that uses cryptographic hashes to detect changes in files and directory trees. The fingerprint command scans a directory tree and generates a fingerprint file containing the names and cryptographic hashes of the files in the tree. This snapshot can be later used to generate a list of files that have been created, deleted or modified. If so much as a single bit in the file data has changed, Fingerprint will detect it.
    2. In cases where I've been concerned about the migration of data (e.g. copying my entire home directory from one system to another), I've used fingerprint to generate a transcript on the source machine, and then run it on the destination machine, to reassure me that the data was copied correctly and completely.
  2. Sep 2024
    1. Die Fossilindustrie finanziert seit Jahrzehten Universitäten und fördert damit Publikationen in ihrem Interesse, z.B. zu false solutions wie #CCS. Hintergrundbericht anlässlich einer neuen Studie: https://www.theguardian.com/business/article/2024/sep/05/universities-fossil-fuel-funding-green-energy

      Studie: https://doi.org/10.1002/wcc.904

    1. Realtalk is just one component of a culture, and downloading source code does not download values, norms, practices, and tacit knowledge. We intend the culture to spread in a manner similar to scientific practices, trades and crafts, martial arts, spoken language, and so on — in-person immersion in a community of practice, teachers teaching teachers. This will take time, and it may appear that Realtalk is “exclusive” during that time. But open-source software is also exclusive, to those who find meaning in source code. And those people already seem well-provided for.

      No tiene porque haber contradicción entre los encuentros en persona, que transmiten y encarnan cultura y los medios digitales donde también transitan. Nuestras Data Rodas tienen también inspiración en una cultura del cuerpo, con encuentros en persona y virtuales, a la vez que producen código y prosa que transita para quienes no están en los encuentros cara a cara.

  3. Aug 2024
    1. When thinking about

      Los datos sobre feminicidios son “datos faltantes”: datos que han sido desatendidos y cuya falta obstaculiza el progreso hacia el fin de la violencia contra las mujeres.

    1. “Oil and gas is a connected network of processes, people, and infrastructure,” Dalgliesh says. “We are working with a client now modeling saltwater disposal wells. If you turn a valve that decreases the flow in a pipeline, it has a downstream effect on the disposal well. Knowledge graphs built on Neo4j are the perfect abstraction layer to model relationships across this kind of complex network and were a much better fit for reView than triple stores.”

      “Oil and gas is a connected network of processes, people, and infrastructure,” ... “We are working with a client now modeling saltwater disposal wells. If you turn a valve that decreases the flow in a pipeline, it has a downstream effect on the disposal well. Knowledge graphs built on Neo4j are the perfect abstraction layer to model relationships across this kind of complex network and were a much better fit for reView than triple stores.” [Jeff Dalgliesh], Chief Technology Officer at Data².

    2. “Analysts need to be able to dissect exactly how the AI reached a particular conclusion or recommendation,” says Chief Business Officer Eric Costantini. “Neo4j enables us to enforce robust information security by applying access controls at the subgraph level.”

      “Analysts need to be able to dissect exactly how the AI reached a particular conclusion or recommendation,” “Neo4j enables us to enforce robust information security by applying access controls at the subgraph level.” Chief Business Officer Eric Costantini.

    1. Nora reminds us, is be attentive to not what has been said but what the relationship is between what has and has not been said. Life happens in between the stories, not in them.

      for - warm data - the silence between words

    1. you can measure data but you cannot measure having an idea you cannot measure Innovation you cannot measure knowledge there's no metric there is no quantifiable scale for knowledge or having an idea you cannot say one meter of knowledge one kilogram of idea

      for - comparison - data vs ideas - no metric for ideas

  4. Jul 2024
    1. DPI can be seen as part of a broader effort to reinvent our relationship to the internet—and, more generally, our digital ecosystem. A large part of its normative appeal stems from the “P” in the acronym: the sense that core functionality on the internet (i.e., identity, payments, data exchange) should not merely serve private ends but rather be reimagined as a set of public goods

      Who needs Venmo when you have this?

    1. Today, data is abundant, but for the most part, unusable. Seventy percent of a data scientist’s job is just cleansing data. The modern software architecture encourages data to be hoarded only accessible through proprietary APIs. And, even with proprietary APIs the market for data integrations is expected to grow to a trillion dollars by the end of the decade. When humanity is spending the GDP of Indonesia just so that the data in System X can work with the data in System Y, the field of software engineering has failed us. So much data - data that could be used by new startups and nonprofits that couldn’t exist today - goes unused because it’s so difficult to access.
  5. Jun 2024
    1. Résumé de la vidéo [00:00:05][^1^][1] - [00:26:39][^2^][2]:

      La vidéo présente une session sur l'open data de Santé publique France, discutant de l'utilisation des données pour différents publics. Elle aborde la refonte de la stratégie d'open data, l'importance de la transparence et de la collaboration, ainsi que les défis liés à la sensibilité des données de santé.

      Points forts: + [00:00:05][^3^][3] Introduction de la session * Présentation des modérateurs et du thème de l'open data * Discussion sur l'utilité des données pour le public + [00:01:49][^4^][4] Projet de mise à jour de la stratégie d'open data * Contextualisation de l'open data et ses principes * Défis spécifiques aux données de santé et leur protection juridique + [00:06:03][^5^][5] Identification des publics cibles et méthodologie * Choix des décideurs publics et acteurs de la société civile comme cibles * Organisation du travail en quatre axes pour répondre aux besoins + [00:10:07][^6^][6] Approche méthodologique combinée * Utilisation de focus groups, enquêtes et entretiens pour collecter des informations * Co-conception avec les acteurs pour construire de futurs indicateurs + [00:13:01][^7^][7] Besoins d'une agence régionale de santé * Importance des données fiables pour la coordination et la régulation * Utilisation des données pour la cartographie et la projection des besoins en soins + [00:25:15][^8^][8] Questions et réponses * Échange avec l'audience sur les fonctions de l'ARS et l'utilisation des outils prédictifs * Discussion sur l'intelligence artificielle et la mesure de la fiabilité des prédictions

      Résumé de la vidéo [00:00:05][^1^][1] - [00:26:39][^2^][2]:

      La vidéo présente une session sur l'open data de Santé publique France, discutant de l'utilisation des données pour différents publics. Elle aborde la refonte de la stratégie d'open data, l'importance de la transparence et de la collaboration, et les défis liés à la sensibilité des données de santé.

      Points forts: + [00:00:05][^3^][3] Introduction à l'open data de Santé publique France * Présentation des animateurs et objectifs de la session * Discussion sur l'utilité des indicateurs en open data + [00:01:48][^4^][4] Projet de mise à jour de la stratégie d'open data * Contexte et principes de l'open data * Caractéristiques et restrictions liées aux données de santé + [00:06:03][^5^][5] Identification des publics cibles et méthodologie * Focus sur les décideurs publics et acteurs de la société civile * Organisation du travail en quatre axes pour répondre aux besoins + [00:12:33][^6^][6] Besoins d'une Agence Régionale de Santé (ARS) * Importance des données fiables pour la coordination et la régulation * Projets et croisement de données pour la prise de décision éclairée

      Résumé de la vidéo [00:50:28][^1^][1] - [01:15:17][^2^][2]:

      La vidéo traite de l'utilisation des données ouvertes de Santé publique France pour améliorer la santé publique. Elle aborde les défis de la communication, de la compréhension et de l'application des données, en particulier à une échelle infracommunale, et souligne l'importance de choisir des indicateurs pertinents pour les politiques de santé.

      Points forts: + [00:50:28][^3^][3] Compréhension des données * Difficultés perçues par les habitants et les associations * Importance de la formation et de la sensibilisation + [00:51:01][^4^][4] Besoins et défis * Faciliter l'accès et l'utilisation des données * Sécurité et anonymat dans le partage des données + [00:53:34][^5^][5] Outils et limites * Développement d'outils pour l'accès aux données * Exemples d'outils utilisés dans d'autres pays

      Résumé de la vidéo [01:15:20][^1^][1] - [01:38:45][^2^][2]:

      La vidéo traite de l'utilisation des données ouvertes de Santé publique France et de leur importance pour divers publics, notamment les politiques de santé et les journalistes. Elle souligne la nécessité d'une approche politique et sociale pour aborder les questions de santé environnementale et la collaboration entre les villes et les régions pour une politique de santé cohérente.

      Points forts: + [01:15:20][^3^][3] Politiques de santé locales * Importance de la collaboration entre villes et départements * Actions municipales spécifiques et politiques régionales plus larges + [01:17:02][^4^][4] Collaboration interrégionale * Nécessité de travailler ensemble sur des sujets communs * Exemple de la trame verte à l'échelle métropolitaine + [01:20:05][^5^][5] Journalisme et données de santé * Impact du COVID-19 sur l'utilisation des données par les journalistes * Importance de la granularité et de la temporalité des données + [01:35:50][^6^][6] Formation des journalistes * Besoin de diversifier les profils dans les écoles de journalisme * Intégration des outils de gestion de données dans la formation

      Résumé de la vidéo [01:38:47][^1^][1] - [02:03:42][^2^][2]:

      Cette vidéo présente une session sur l'open data de Santé publique France, discutant des données disponibles pour différents publics. Les intervenants explorent les défis de la production d'indicateurs, la médiation des données, et l'équilibre entre la rapidité de mise en ligne et l'accompagnement nécessaire pour les utilisateurs.

      Points forts: + [01:38:47][^3^][3] Production et médiation des données * Temps de production incompressible * Choix entre rapports détaillés ou données agrégées rapides * Dilemme entre l'accompagnement et la rapidité + [01:39:47][^4^][4] Diffusion des données et expertise * Journalistes cherchent des mises à jour régulières * Importance d'une explication succincte avec les données * Rapports d'experts pour une diffusion plus large + [01:41:11][^5^][5] Formation des journalistes et collaboration * Formation à la démarche scientifique * Collaboration avec Santé publique France pour une information précise * Besoin de données infracommunales pour les villes + [01:47:26][^6^][6] Troisième vague de l'Open Data * Travailler avec les usagers autour d'objectifs de politique publique * Étendre le public des données et développer la datalitéracie * Importance de connaître les usagers actuels et potentiels des données + [01:58:36][^7^][7] Accès aux données et enjeux de santé publique * Difficultés d'accès aux données infracommunales * Nécessité de partenariats pour des données plus fines * Enjeux sensibles liés à la restitution des données de santé

      Résumé de la vidéo [02:03:49][^1^][1] - [02:27:30][^2^][2]:

      Cette partie de la vidéo discute de l'open data de Santé publique France et de l'identification des publics nécessitant des données spécifiques. Elle aborde les défis de la médiation et de la définition des besoins en données pour divers secteurs, y compris la santé et l'environnement.

      Points forts: + [02:03:49][^3^][3] Identification des besoins en données * Difficulté à dialoguer et à médier entre les fournisseurs de données et les utilisateurs * Importance de définir clairement les besoins en données pour les politiques publiques + [02:08:59][^4^][4] Exemples de données non accessibles * Manque de données sur la vaccination au niveau local pendant la COVID-19 * Difficulté à obtenir des données de santé scolaire pour les villes + [02:17:01][^5^][5] Création de nouvelles données pour les politiques publiques * Nécessité de produire des données pertinentes pour répondre à des problèmes spécifiques * Exemple du baromètre des villes cyclables pour évaluer la cyclabilité + [02:22:02][^6^][6] Littératie en données de santé et obstacles à l'ouverture des données * Importance de la formation pour comprendre la production et la collecte de données * Défis liés à l'accessibilité et à l'utilité des données pour le grand public

      Résumé de la vidéo [02:27:32][^1^][1] - [02:42:03][^2^][2]:

      La vidéo aborde l'importance de l'open data de Santé publique France et les défis liés à la collecte, la documentation et l'utilisation des données pour divers publics. Elle souligne la nécessité d'une documentation claire des données et d'une médiation pour aider les utilisateurs à comprendre et à utiliser les données de manière éthique et efficace.

      Points forts: + [02:27:32][^3^][3] L'éthique de l'open data * Discussion sur la pertinence éthique de détailler l'état de santé des citoyens * Importance de la transparence et de la responsabilité dans la collecte des données + [02:28:02][^4^][4] La documentation des données * Présentation du "datashheet for dataset" pour une documentation standardisée * Importance de documenter le processus de collecte et le contexte de production des données + [02:30:29][^5^][5] Les besoins des utilisateurs territoriaux * Manque de connaissances précises sur l'état de santé des populations locales * Exemple d'une ville ayant besoin de données pour répondre à une situation de soins de santé + [02:33:48][^6^][6] La démarche de la ville de Paris * Création de portraits de santé infracommunaux pour répondre aux besoins des acteurs locaux * Processus participatif impliquant élus et partenaires de santé pour identifier les indicateurs pertinents

    1. TensionThe ability to see like a data structure afforded us the technology we have today. But it was built for and within a set of societal systems—and stories—that can’t cope with nebulosity. Worse still is the transitional era we’ve entered, in which overwhelming complexity leads more and more people to believe in nothing. That way lies madness. Seeing is a choice, and we need to reclaim that choice. However, we need to see things and do things differently, and build sociotechnical systems that embody this difference.This is best seen through a small example. In our jobs, many of us deal with interpersonal dynamics that sometimes overwhelm the rules. The rules are still there—those that the company operates by and laws that it follows—meaning there are limits to how those interpersonal dynamics can play out. But those rules are rigid and bureaucratic, and most of the time they are irrelevant to what you’re dealing with. People learn to work with and around the rules rather than follow them to the letter. Some of these might be deliberate hacks, ones that are known, and passed down, by an organization’s workers. A work-to-rule strike, or quiet quitting for that matter, is effective at slowing a company to a halt because work is never as routine as schedules, processes, leadership principles, or any other codified rules might allow management to believe.The tension we face is that on an everyday basis, we want things to be simple and certain. But that means ignoring the messiness of reality. And when we delegate that simplicity and certainty to systems—either to institutions or increasingly to software—they feel impersonal and oppressive. People used to say that they felt like large institutions were treating them like a number. For decades, we have literally been numbers in government and corporate data structures. BreakdownAs historian Jill Lepore wrote, we used to be in a world of mystery. Then we began to understand those mysteries and use science to turn them into facts. And then we quantified and operationalized those facts through numbers. We’re currently in a world of data—overwhelming, human-incomprehensible amounts of data—that we use to make predictions even though that data isn’t enough to fully grapple with the complexity of reality.How do we move past this era of breakdown? It’s not by eschewing technology. We need our complex socio-technical systems. We need mental models to make sense of the complexities of our world. But we also need to understand and accept their inherent imperfections. We need to make sure we’re avoiding static and biased patterns—of the sort that a state functionary or a rigid algorithm might produce—while leaving room for the messiness inherent in human interactions. Chapman calls this balance “fluidity,” where society (and really, the tech we use every day) gives us the disparate things we need to be happy while also enabling the complex global society we have today.
    2. To boost its search engine rankings, Thai Food Near Me, a New York City restaurant, is named after a search term commonly used by potential customers. It’s a data layer on top of reality. And the problems get worse when the relative importance of the data and reality flip. Is it more important to make a restaurant’s food taste better, or just more Instagrammable? People are already working to exploit the data structures and algorithms that govern our world. Amazon drivers hang smartphones in trees to trick the system. Songwriters put their catchy choruses near the beginning to exploit Spotify’s algorithms. And podcasters deliberately mispronounce words because people comment with corrections and those comments count as “engagement” to the algorithms.These hacks are fundamentally about the breakdown of “the system.” (We’re not suggesting that there’s a single system that governs society but rather a mess of systems that interact and overlap in our lives and are more or less relevant in particular contexts.)
  6. May 2024
    1. Governments and companies need to spend an extra $34 trillion on the clean energy transition between now and 2050 to reach net-zero emissions, according to BloombergNEF.

      Die Kosten der Energiewende liegen deutlich höher als bisher angenommen.

    1. Linked Data in Production: Moving Beyond Ontologies

      Spring 2024 Member Meeting: CNI websiteYouTube

      David Newbury Assistant Director, Software and UX Getty

      Over the past six years, Getty has been engaged in a project to transform and unify its complex digital infrastructure for cultural heritage information. One of the project’s core goals was to provide validation of the impact and value of the use of linked data throughout this process. With museum, archival, media, and vocabularies in production and others underway, this sessions shares some of the practical implications (and pitfalls) of this work—particularly as it relates to interoperability, discovery, staffing, stakeholder engagement, and complexity management. The session will also share examples of how other organizations can streamline their own, similar work going forward.

      http://getty.edu/art/collection/ http://getty.edu/research/collections/ http://vocab.getty.edu https://www.getty.edu/projects/remodeling-getty-provenance-index/

    1. Seit dem Pariser Abkommen finanzierten die 60 größten Banken 425 fossile Großprojekte - sogenannte carbon bombs mit einem zu erwartenden CO2-Ausstoß von jeweils über einer Gigatonne - mit insgesamt 1,8 Billionen Dollar. Der Standard-Artikel geht auf ein Projekt zurück, bei dem Daten des Carbon Bombs-Projekts, des Global Energy Monitor und von Banking on Climate Chaos ausgewertet und visualisiert werden. https://www.derstandard.at/story/3000000193065/billionenkredite-fuer-fossile-grossprojekte-wie-banken-die-klimakrise-mitfinanzieren

      Bericht/Visualisierung: https://www.carbonbombs.org/

    1. In den Ländern, die sich in Paris 2015 einer Initiative gegen das Verbrennen von nicht genutztem Erdgas (flaring) angeschlossen hatten, wird das Verbrennen mit offener Flamme oft nur durch Verbrennung in geschlossenen Anlagen ersetzt, wie eine investigative journalistische Recherche ergab. Die Menge der Emissionen sinkt dadurch nicht wesentlich, aber diese Anlagen sind für Satelliten nicht äußerlich erkennbar. https://www.theguardian.com/environment/2024/may/02/methane-emissions-gas-flaring-hidden-satellite-monitors-oil-gas

      Ressourcen für die Recherche zu Methan-Emissionen: https://gijn.org/resource/new-tools-investigate-methane-emissions/

  7. Apr 2024
    1. web security is provided at the transport level (TLS); it is not an independent attribute of the messages themselves

      I.e., in web, parties that reside on the ends of an encrypted channel authorize each other. Whereas data that's passed between them does not have this authorization built in.

      Taking a reverse approach, akin to having locks on data and not a channel, we can have authorization on data and not the channel.

  8. www.oecd-ilibrary.org www.oecd-ilibrary.org
    1. Several digital reforms projects sometimes require the same data to be collected multiple times depending on the authority in charge. Better cooperation between data owners (ministries and their departments) can ensure that data is collected systematically and is fit for future use.
    1. The consensus is reached in the same way as fortransactions i.e. using hasgraph consensus algorithm. The onlydifference is, that the concerning events in the hashgraph nowcontain other type of data instead of transactions

      Not necessarily, how to store received events is an implementation detail. One could dump them in an array on a side. Can be as efficient as array of pointers to events. Where idx of this array is event's position in total order.

    Tags

    Annotators

    1. What are some top UX design principles when designing for kids?Some important UX design principles when designing for kids are as follows. Simplicity and clarity Interactive and engaging elements Age-appropriate content Safety and privacy Consistent feedback and rewards

      There's 5 in this list and there was 4 in the other - I think Safety and Privacy is the one additional but it's also in my proposal because I am concerned about it too.

  9. Mar 2024
    1. Sekurak – 4373 Niebezpiecznik – 4171 Z3S – 3383

      Comparison of the frequency of posting by the most popular polish cybersecurity blogs: 1. Sekurak 2. Niebezpiecznik 3. Z3S

    1. Résumé de la vidéo [00:00:01][^1^][1] - [00:22:59][^2^][2]:

      Cette vidéo présente les objectifs et les activités de la Fabrique des Mobilités (FabMob), une association qui vise à promouvoir une mobilité durable et moins émettrice de carbone. Elle explique le concept de commun numérique et son application pratique dans le secteur de la mobilité, en mettant l'accent sur la coopération entre acteurs hétérogènes et la gouvernance partagée des ressources numériques.

      Points forts: + [00:00:01][^3^][3] Introduction de FabMob * Présentation des objectifs * Définition d'un commun numérique + [00:04:00][^4^][4] Rôle de la DGITM * Collaboration avec FabMob * Importance des communs dans la mobilité + [00:08:03][^5^][5] Modalités de participation * Encouragement des questions * Cycle de travail sur les outils numériques + [00:09:01][^6^][6] Définition académique d'un commun * Trois piliers : ressource, communauté, gouvernance * Exemples de communs numériques + [00:13:20][^7^][7] Panorama institutionnel * Diverses institutions impliquées dans les communs numériques * Exemples européens et français + [00:20:36][^8^][8] Distinction entre Open Data, Open Source et commun numérique * Explication des termes * Importance de la gouvernance des données Résumé de la vidéo [00:23:01][^1^][1] - [00:45:09][^2^][2]:

      La partie 2 de la vidéo aborde la logique d'Open Data, d'OP source, et de commun numérique dans le contexte français, en mettant l'accent sur l'importance de l'ouverture, des licences variées, et de la gouvernance collective pour le partage des ressources numériques.

      Points forts: + [00:23:01][^3^][3] Open Data et OP source * Accès libre aux logiciels * Licences variées + [00:23:37][^4^][4] Commun numérique * Service de sa communauté * Pas nécessairement ouvert + [00:25:02][^5^][5] Avantages du numérique * Effets de réseau * Coûts de réplication faibles + [00:27:00][^6^][6] Gouvernance collective * Importance de la fédération * Gestion de la ressource + [00:31:11][^7^][7] Exemples concrets * Affluence TC à Grenoble * Intelligence artificielle dans les transports + [00:43:42][^8^][8] Politiques publiques par les communs * Réduction des coûts * Transparence et pérennité Résumé de la vidéo [00:45:11][^1^][1] - [01:05:36][^2^][2]:

      La vidéo discute de l'importance de rendre les données de réglementation routière accessibles et utilisables pour les collectivités, en particulier pour l'intégration dans les systèmes GPS. Elle souligne la nécessité d'une collaboration communautaire pour créer une base de données exhaustive et utile.

      Points forts: + [00:45:11][^3^][3] Accessibilité des données * Simplifier l'utilisation des données pour les collectivités * Créer des outils de navigation intuitifs + [00:46:01][^4^][4] Intégration GPS * Intégrer les règles de circulation dans les GPS * Adapter la navigation aux spécificités des véhicules + [00:47:03][^5^][5] Avantages logistiques * Faciliter la traduction des règlements pour les chauffeurs étrangers * Améliorer la coordination entre les services de gestion du réseau + [00:48:00][^6^][6] Applications futures * Imaginer des usages réglementaires dynamiques * Permettre une créativité réglementaire avec les données numériques Résumé de la vidéo [01:05:38][^1^][1] - [01:25:41][^2^][2]:

      Cette vidéo discute des incitations financières pour le covoiturage en France, des défis de fraude et de la création d'un registre de preuve de covoiturage pour sécuriser les trajets et encourager l'adoption du covoiturage.

      Points forts: + [01:05:38][^3^][3] Incitations pour le covoiturage * Gratuité pour les passagers * Rémunération pour les conducteurs + [01:06:14][^4^][4] Forfait mobilité durable * Jusqu'à 800 € par an pour les salariés + [01:06:28][^5^][5] Primes de l'État * 100 € pour les nouveaux covoitureurs + [01:07:10][^6^][6] Défis de fraude * Risques liés aux incitations financières + [01:07:58][^7^][7] Registre de preuve de covoiturage * Infrastructure numérique contre la fraude + [01:11:02][^8^][8] Communauté et gouvernance * Plus de 700 collectivités impliquées Résumé de la vidéo [01:15:00][^1^][1] - [01:22:59][^2^][2]:

      La vidéo aborde le concept des communs numériques, leur importance dans la transition écologique et la mobilité, et comment ils favorisent la coopération entre divers acteurs. Elle souligne l'importance de la gouvernance collective et présente des exemples concrets de communs numériques dans le secteur des transports.

      Points clés: + [01:15:00][^3^][3] Définition des communs numériques * Trois piliers : ressource partagée, communauté hétérogène, règles de gouvernance + [01:17:00][^4^][4] Exemples de communs numériques * Open Street Map, logiciels, données, serveurs + [01:19:00][^5^][5] Institutions et communs numériques * Directions ministérielles, agences nationales, collectivités + [01:21:00][^6^][6] Différence entre Open Data, Open Source et communs numériques * Open Data : données en accès libre; Open Source : code source ouvert; Communs numériques : gestion collective de ressources numériques

    1. Empower doesn't allow you to import legacy data from other sources (like Mint) or input manual transactions such as cash. The latter isn't important to me, but the former certainly is. I have 16 years of transaction data in Mint that I want to preserve.
  10. www.monarchmoney.com www.monarchmoney.com
    1. Our diagrams and charts make it easy to see where every dollar of your hard-earned money is flowing, so you can track your spending patterns at a glance.
    1. some of our older applications rely substantially on manual extract, transform and load (ETL)processes to pass data from one system to another. This substantially increases the volumeof customer and staff data in transit on the network, which in a modern data managementand reporting infrastructure would be encapsulated in secure, automated end-to-end

      Reliance on ETL seen as risky

      I’m not convinced about this. Real-time API connectivity between systems is a great goal…very responsive to changes filtering through disparate systems. But a lot of “modern” processing is still done by ETL batches (sometimes daily, sometimes hourly, sometimes every minute).

    1. Ironically, data brokers need to collect additional info to verify your identity and ensure they’re deleting the right person’s data.
    1. What if I don’t live in California?Only California residents have the right to data deletion under CCPA. (Why companies have the right to your data and you do not is another story. And here’s another. And another.)But some companies have said they’ll honor deletion requests no matter where you live. Spotify, Uber and Twitter said they treat deletion requests from any geographic location the same. Netflix, Microsoft, Starbucks and UPS have also said they’ll extend CCPA rights to all Americans.
    2. The company will probably ask for you to send over additional information or set up an appointment to verify your identity — that’s so no one can pretend to be you and steal or delete your data. To verify, you may need to confirm your account username and password, provide a piece of data like your phone number for the company to cross-check, or, rarely, show your government-issued ID. You should never be required to set up an account to get your data deleted, according to CCPA.
    3. People have to verify their identities before companies can delete data, which poses an extra obstacle.
    1. Nobody can see deleted accounts - not even developers. Deleted accounts are fully deleted. There's nothing to see basically by definition.
    2. There is no active user with that ID, so you cannot search by it. The whole point of deleting an account is to make it inaccessible, unreferenced, and unlinked. We're not going to implement "soft" account deletion.
    3. You cannot. And you're not supposed to. When an account is deleted, it is disassociated from all existing posts by design.
    1. Udi Dahan wrote about this in Don't Delete - Just Don't. There is always some sort of task, transaction, activity, or (my preferred term) event which actually represents the "delete". It's OK if you subsequently want to denormalize into a "current state" table for performance, but do that after you've nailed down the transactional model, not before. In this case you have "users". Users are essentially customers. Customers have a business relationship with you. That relationship does not simply vanish into thin air because they canceled their account. What's really happening is:
    2. The truth is that both of these approaches are wrong. Deleting is wrong. If you're actually asking this question then it means you're modelling the current state instead of the transactions. This is a bad, bad practice in database-land.
    3. In any system even remotely tied to money, hard-deletion violates all sorts of accounting expectations, even if moved to an archive/tombstone table. The correct way to handle this is a retroactive event.
  11. Feb 2024
    1. The data on the 463 courses at UT Austin can be found in the evals data frame included in the moderndive package
    1. (The more modication a library demands of eachMARC record, the more it costs.) In Harvard’s case she typicallyaccepts the record as is, even when the original card bearsadditional subject headings or enriching notes of various kinds.

      Information loss in digitizing catalog cards...

    1. Molly White on 'ownership' wrt digital stuff. Check for the various aspects she lifts out. wrt 'your data' Vgl [[On Selling Access to Your Data and Ownership of Data – Interdependent Thoughts 20220209114247]] and [[Saying My Data Is Too Imprecise]]. For (personal) data ownership is not a useful concept.

    1. The UCLA Loneliness Index has shot up in recent years, and I think we’ve mentioned loneliness already. And it's one of the key things that people say when you ask them about their lives. They say they're lonely.

      Where can you find data for this? I hear this statistic quoted often but not sure where i can find per-country data on this.

  12. Jan 2024
    1. I have compiled a list of database sources for global information about energy so you can save time.

      List of database sources for global information about energy

  13. Dec 2023
    1. There is a growing need for open standards for formats used to represent text, images, video and other collections of data, so that one producer's data will be accessible to another's software.

      Data formats are like currency. Either standardize it or make sure there are converters. Money exchange. Most used formats are valuable but also valuable content in a rare format makes the converter more valuable.

    1. 26

      ¿Qué onda con este bajón? No hace sentido.

    2. hurn

      Los churn rates en esta tabla son más altos para las niñas y, sin embargo, en la primera tabla el churn rate de niñas es menor que el de niños

      • for: remote COP29 project proposal - demographic data

      • comment

        • this is the first year the full participants list has been published. If it shows city/country of origin, that would be very useful for this proposal
  14. Nov 2023
    1. ActiveRecord::Base.normalizes declares an attribute normalization. The normalization is applied when the attribute is assigned or updated, and the normalized value will be persisted to the database. The normalization is also applied to the corresponding keyword argument of query methods, allowing records to be queried using unnormalized values.

      Guess I don't need to use mdeering/attribute_normalizer gem anymore...

  15. Oct 2023
    1. Description: The European Language Social Science Thesaurus (ELSST) is a broad-based, multilingual thesaurus for the social sciences. It is owned and published by the Consortium of European Social Science Data Archives (CESSDA) and its national Service Providers. The thesaurus consists of over 3,000 concepts and covers the core social science disciplines: politics, sociology, economics, education, law, crime, demography, health, employment, information and communication technology and, increasingly, environmental science.

    1. We wrześniu 2023 roku w większości badanych zawodów zanotowano spadki liczby ofert pracy rok do roku Największy widoczny jest w branży IT – pracodawcy opublikowali o 52 proc. mniej ofert rok do roku
    1. The important part, as is so often the case with technology, isn’t coming up with a solution to the post portability problem, but coming up with a solution together so that there is mutual buy-in and sustainability in the approach.

      The solution is to not create keep creating these fucking problems in the first place.

  16. Sep 2023
    1. Das Meeeis um die Antarktis bedeckt in diesem September so wenig Ozean Fläche wie in keinem September der Messgeschichte. Im September erreicht es seine maximale Ausdehnung. In diesem diesem Jahr liegt sie 1,75 Millionen Quadratmeter Kilometer unter dem langjährigen Durchschnitt und eine Million Quadratmeter unter dem bisher niedrigsten September-Maximum. Im Februar wurde auch bei der geringsten Ausdehnung des antarktischen Meereises ein Rekord verzeichnet. Ob und wie diese Entwicklung mit der globalen Erhitzung zusammenhängt ist noch unklar. Die obersten 300 m des Ozeans um die Antarktis sind deutlich wärmer als früher. https://www.theguardian.com/world/2023/sep/26/antarctic-sea-ice-shrinks-to-lowest-annual-maximum-level-on-record-data-shows

    1. It' is pretty good to see the mapping innovation taking several shapes, from the starting narrative to this one.

      Regarding feedback from this one I would make a call out that make more visible where the data and code behind the map is hosted and how to reproduce the results.

      On a more general sense, I think is important to see how the different narratives are better connected and which values they embody and make explicit. I would propose this values:

      1. Utility:

        • internal: helping us to make short or long lasting peer to peer connections like the one between Copincha (Habana, Cuba) and HackBo/Grafoscopio (Bogotá, Colombia) communities resulting from DOTS 202.
        • external to showcase which innovation, people and communities are doing and how they are connected now or can be in the future.
      2. Reproducibility: The data narratives should be able to be reproducible.

      3. Portability: Functionality bundles, including data, code, software should be packages to they can be used in local contexts, particularly those with low/intermittent internet connectivity.

      4. Recontextualization: Our data narratives should be empowering its reuse, adaptation, and extension by other communities and in other context.

      5. Commons/Community oriented: licenses on data/code should be explicit to allow the previous qualities. Some times that would require a copyfarleft license that protect third parties extract value from the data narratives and its bundles against the community interest (cfg current discussion on data collection from IA projects against community of creators).
    1. “There are no safeguards on what information it can ask for.”

      This is wrong. Section 36 of the Act says:

      The Central Government may, for the purposes of this Act, require the Board and any Data Fiduciary or intermediary to furnish such information as it may call for.

    1. Migration from pre-exisiting non-flatpak installations In order to migrate from pre-exisiting non-flatpak installation and preserve all settings please copy or move entire ~/.thunderbird folder into ~/.var/app/org.mozilla.Thunderbird/.thunderbird In case Thunderbird opens a new profile instead of the existing one, run: flatpak run org.mozilla.Thunderbird -P then select the right profile and tick "Use the selected profile without asking on startup" box.
  17. www.bgccan.com