Shaare your links...
379 links
Filou GeekNik : Sécurité / libre / p2P / réseaux / bidouilles / no net / etc Home Login RSS Feed ATOM Feed Tag cloud Picture wall Daily
Links per page: 20 50 100
page 1 / 1
6 results for tags semantique x
  • RAG génération augmentée de récupération + apprentissage fédéré
    L'intelligence artificielle générative (IA) excelle dans la création de réponses textuelles basées sur de grands modèles de langage (LLM), où l'IA est entraînée sur un grand nombre de points de données. La bonne nouvelle est que le texte généré est souvent facile à lire et fournit des réponses détaillées qui sont largement applicables aux questions posées par le logiciel, habituellement appelées invites.

    La mauvaise nouvelle est que les informations utilisées pour générer la réponse sont limitées aux informations utilisées pour entraîner l'IA, souvent un LLM généralisé. Les données du LLM peuvent être périmées depuis des semaines, des mois ou des années et, dans un chatbot d'IA d'entreprise, elles peuvent ne pas prendre en compte des informations spécifiques aux produits ou services de l'entreprise. Cela peut conduire à des réponses incorrectes qui érodent la confiance en la technologie de certains clients et collaborateurs."
    https://www.oracle.com/fr/artificial-intelligence/generative-ai/retrieval-augmented-generation-rag/


    "les biais présents dans les algorithmes soulèvent des questions éthiques profondes. Une approche décentralisée, comme l’apprentissage fédéré, pourrait offrir une solution pour garantir des modèles plus inclusifs et respectueux de la vie privée."
    https://www.wedemain.fr/respirer/vers-une-ia-plus-juste-et-respectueuse-lapprentissage-federe-pour-lutter-contre-les-biais/?utm_source=pocket-newtab-fr-fr
    Tue Nov 12 13:42:58 2024 - permalink -
    - https://www.oracle.com/fr/artificial-intelligence/generative-ai/retrieval-augmented-generation-rag/
    actualité bdd bigdata fédération ia recherche semantique
  • catalogue OPDS
    https://fr.wikipedia.org/wiki/OPDS
    https://en.wikipedia.org/wiki/Open_Publication_Distribution_System#External_links

    # Voir ausi
    https://fr.wikipedia.org/wiki/Dublin_Core
    https://fr.wikipedia.org/wiki/Simple_Knowledge_Organization_System

    https://bu.unistra.fr/opac/article/tutoriels/trouver_tutoriels#sources (Click&Read : une extension de navigateur pour faciliter l'accès au texte intégral des articles ; )
    https://clickandread.inist.fr/ recherche d’identifiants documentaires (DOI, PMID, PII)
    https://www.istex.fr/les-identifiants-de-type-publication/

    DOI (Digital Object Identifier) + ISBN (International Standard Book Number) et l’ISSN (International Standard Serial Number)  Publisher Item Identifier (PII) et le Serial Item and Contribution Identifier (SICI). PubMed IDentifier (PMID)


    # Et aussi contenus / catalogue / inventaires / logiciels gestion contenus / couche bibliobox

    http://www.pearltrees.com/geeknik/bibliobox-piratebox-librarybox/id20486894 (infos outils de recherche de livre)
    https://github.com/wallabag/wallabag
    Shaarli :=))
    https://framablog.org/2021/06/16/partagez-linventaire-de-votre-bibliotheque-avec-vos-proches-sur-inventaire-io/
    https://www.senscritique.com/ (film et série)

    https://www.mediatheques.strasbourg.eu
    https://lirenotremonde.strasbourg.eu/

    https://www.eurekoi.org/
    https://www.babelio.com/

    https://booknode.com/profil/Artemissia
    https://www.livraddict.com/profil/artemissia/
    https://www.goodreads.com/user/year_in_books/2024/86248406

    # Vente livres et bédés

    Livres anciens, rares et de collection sur AbeBooks - https://www.abebooks.fr/livres-anciens-rares-collection
    https://www.chasse-aux-livres.fr/
    https://www.vialibri.net/
    https://www.momox.fr/

    0utils utiles
    https://www.bedetheque.com/ventes/etats
    https://www.tintin.com/fr/collectors/bdm
    https://isbnsearch.org/
    http://www.pearltrees.com/geeknik/bibliobox-piratebox-librarybox/id20486894 (infos outils de recherche de livre)


    Et aussi
    https://liens.azqs.com/azqs/?searchtags=livre
    Thu Jan 4 00:12:27 2024 - permalink -
    - https://www.liseuses.net/liseuses-opds/
    atom bibliothèque data ebook lecteur livre opds rss semantique syndication sémantique texte txt édition
  • Recueillir des données sur le Web - Guide du datajournalisme
    << parle des extensions :   Readability > permet d’extraire manuellement le texte d’une page web et du concept général
    et aussi
    https://wydden.com/10-outils-pour-scraper-des-donnees-sans-coder-ou-presque/ (services en ligne, plugin, cadriciel)

    # Web_scraping
    https://fr.wikipedia.org/wiki/Web_scraping

    # Solutions / cadriciels
    https://fr.wikipedia.org/wiki/Scrapy (ligne de commande et Phyton) https://github.com/scrapy/scrapy
    https://fr.wikipedia.org/wiki/Weboob (sites préréglés) http://weboob.org/modules http://planet.weboob.org/

    https://linuxfr.org/news/weboob-sort-une-nouvelle-version-qui-va-vous-porter-chance
    https://linuxfr.org/news/weboob-une-version-1-1-pour-son-sixieme-anniversaire
    https://linuxfr.org/news/weboob-sort-une-nouvelle-version-qui-va-vous-porter-chance
    https://www.pycon.fr/2017/programme.html#la-puissance-du-scraping-web-avec-weboob
    https://www.pycon.fr/2017/programme.html#weboob-le-navigatueur

    L'utilisateur qui cherche une boîte à outils s'oriente vers scrapy, et celui que veut du clé-en-main va vers weboob.
    https://linuxfr.org/users/lebouquetin/journaux/extraction-de-donnees-du-web-introduction-a-scrapy-journal-bookmark (parle des deux dans les commentaires, Tuto, XPATH )
    https://linuxfr.org/users/lebouquetin/journaux/pyjobs-un-job-board-pour-les-agreger-tous
    https://fr.wikipedia.org/wiki/XPath (langage d'exploration)

    https://fr.wikipedia.org/wiki/OutWit_Hub
    https://pypi.org/project/scraperwiki/
    https://pypi.org/user/scraperwiki/ (service en ligne uniquement ?)

    # Navigateur web sans tête (sans interface graphique) scriptable utilisé pour automatiser des interactions avec des pages web
    https://fr.wikipedia.org/wiki/Navigateur_sans_t%C3%AAte
    https://fr.wikipedia.org/wiki/PhantomJS Le projet est abandonné en  2017 du fait de l'ajout du mode sans tête dans Chrome 59 et 60.
    https://developer.mozilla.org/fr/docs/Mozilla/Firefox/Headless_mode

    https://www.youtube.com/watch?v=JvaQ7kS2hEM&t=197s
    https://www.automation-facile.fr/

    https://fr.wikipedia.org/wiki/Selenium_(informatique)
    https://en.wikipedia.org/wiki/Katalon_Studio https://github.com/katalon-studio
    https://en.wikipedia.org/wiki/Comparison_of_GUI_testing_tools

    # Extension navigateur
    https://addons.mozilla.org/fr/firefox/search/?platform=Linux&q=Scraper&sort=users&type=extension
    https://addons.mozilla.org/fr/firefox/addon/web-scraper (c'est aussi un service en ligne)
    https://addons.mozilla.org/fr/firefox/addon/datascraper/
    https://data-miner.io/ (Chrome)


    # Autres
    https://pypi.org/search/?q=scrap
    https://pypi.org/search/?q=scrappe
    https://pypi.org/search/?q=scrapper
    https://pypi.org/search/?q=scraping
    https://pypi.org/search/?q=scrapping

    https://gitlab.com/search?search=scrap
    https://gitlab.com/search?search=scrappe
    https://gitlab.com/search?search=scrapper
    https://gitlab.com/search?search=scraping
    https://gitlab.com/search?search=scrapping

    https://korben.info/extraire-des-donnees-structurees-partir-dun-pdf.html
    https://fr.wikipedia.org/wiki/Aspirateur_de_site_web
    https://fr.wikipedia.org/wiki/HTTrack
    https://github.com/OWASP/Amass (liste les adresses d'un site)
    Wed Sep 20 21:08:08 2023 - permalink -
    - http://jplusplus.github.io/guide-du-datajournalisme/pages/0504.html
    aspiration automatisation data DEV extraction harvesting information journalisme mining navigateur osint scraping semantique service SITE sémantique web
  • Le Web sémantique, ou toile sémantique
    https://fr.wikipedia.org/wiki/Web_s%C3%A9mantique
    https://fr.wikipedia.org/wiki/Web_des_donn%C3%A9es
    https://fr.wikipedia.org/wiki/Ontologie_(informatique)

    https://fr.wikipedia.org/wiki/Resource_Description_Framework
    https://fr.wikipedia.org/wiki/Extensible_Markup_Language
    https://fr.wikipedia.org/wiki/Web_Ontology_Language
    https://fr.wikipedia.org/wiki/Microformat

    https://fr.wikipedia.org/wiki/Notation3

    https://fr.wikipedia.org/wiki/Turtle_(syntaxe)
    https://fr.wikipedia.org/wiki/JSON-LD

    https://fr.wikipedia.org/wiki/Semantically-Interlinked_Online_Communities
    https://fr.wikipedia.org/wiki/Simple_Knowledge_Organization_System
    https://fr.wikipedia.org/wiki/RDFa
    https://fr.wikipedia.org/wiki/Dublin_Core

    https://fr.wikipedia.org/wiki/DocBook
    https://fr.wikipedia.org/wiki/VCard
    https://fr.wikipedia.org/wiki/FOAF

    https://fr.wikipedia.org/wiki/HTML_s%C3%A9mantique

    # Plus
    https://fr.wikipedia.org/wiki/Diagramme_de_flux_de_donn%C3%A9es
    https://fr.wikipedia.org/wiki/Mod%C3%A8le_(informatique)
    https://fr.wikipedia.org/wiki/Expression_r%C3%A9guli%C3%A8re (Expression régulière)

    # Exemples concrets

    Le bus sémantique : cet outils d’agrégation permet une réactualisation automatique des données pour chaque initiative (agenda, annuaire, situation géographique…) dès la source mise à jour en les transformant en web sémantique
    https://transiscope.org/les-technologies-utilisees/
    https://wiki.resilience-territoire.ademe.fr/wiki/Le_Bus_S%C3%A9mantique
    https://data-players.com/bus-semantique/

    https://omeka.fr/omekas  "Omeka s'attache à respecter les recommandations du W3C, les normes 508 d'accessibilité et les standards de métadonnées (Dublin Core par défaut)."

    # Accessibilité
    https://www.alsacreations.com/tuto/liste/3-Accessibilite
    https://marjorieober.com/nextcloud/s/BLwX458bBB2CfTW?dir=undefined&path=%2FAteliers%2Faccessibilite&openfile=28115
    https://hackstub.eu/accessibilite/
    https://fr.wikipedia.org/wiki/Windows-1252 (problème avec les vieux textes)
    https://fr.wikipedia.org/wiki/Cat%C3%A9gorie:Accessibilit%C3%A9_num%C3%A9rique
    Wed Mar 15 23:44:12 2023 - permalink -
    - https://fr.wikipedia.org/wiki/Web_s%C3%A9mantique
    accéssibilité codage data DEV donnee handicape internet semantique sémantique texte txt web xml
  • ical iCalendar
    Format de données discuté et proposé par la RFC 55451 pour les échanges de données de calendrier.

    hCalendar (raccourci de HTML iCalendar) est un standard Microformat destiné à afficher une représentation sémantique XHTML du format iCalendar concernant l'information à propos d'un événement sur les pages web. https://fr.wikipedia.org/wiki/HCalendar
    détails : http://microformats.org/wiki/hcalendar-fr

    Exemple code php : https://gist.github.com/jakebellacera/635416
    https://forum.arn-fai.net/t/cal11y-calendrier-accessible/9377 (liste quelque bibliothèques)

    # Protocoles

    VebDav (via son Extension calendriers) https://fr.wikipedia.org/wiki/WebDAV  
    Partage de calendriers CalDAV RFC 47913 (à ne pas confondre avec Web Calendar Access Protocol qui partage des fichiers iCalendar avec WebDAV. Ce dernier est l'association de deux RFC : celle définissant WebDAV et celle définissant iCalendar) ;
    CalDAV  : https://fr.wikipedia.org/wiki/CalDAV
    Web Calendar Access Protocol  https://fr.wikipedia.org/wiki/Web_Calendar_Access_Protocol

    # Applications
    https://doc.ubuntu-fr.org/davical  (serveur)
    https://www.developpez.net/forums/d891600/java/developpement-mobile-java/android/traitement-d-fichier-ics-icalendar/ (fonction / librairie)
    https://en.wikipedia.org/w/index.php?fulltext=1&search=List+of+applications+with+iCalendar+support&title=Special%3ASearch&ns0=1 ()
    https://www.facebook.com/help/152652248136178/ Comment ajouter des évènements Facebook à mon calendrier ?
    https://www.facebook.com/help/work/897976446932009 (Exporter des évènements dans mon calendrier depuis Workplace)

    https://www.bernutz.net/?App-Empfehlungen/Tools/Kalender-Backup
    https://forum.arn-fai.net/t/ameliorations-sans-nuage-fr-pour-associations-et-familles/7161/13
    https://mobilizon.fr/
    https://pretalx.com/p/about/

    https://docs.framasoft.org/fr/agenda/

    https://www.mathieuweb.fr/calendrier/synchronisation-ical.php

    https://liens.azqs.com/azqs/?searchtags=agenda

    # Concepts proches de ical

    Fediverse : https://liens.azqs.com/GeekNik/?searchtags=fediverse
    Scraping (extraction de données) https://liens.azqs.com/GeekNik/?searchtags=scraping
    Mqqt (internet des objets - iot) https://liens.azqs.com/GeekNik/?searchtags=mqtt
    API :  https://liens.azqs.com/GeekNik/?searchtags=api
    Web Sémantique (RDF - XML - URI - OWL -  DocBook - GML - ...)  https://liens.azqs.com/GeekNik/?searchtags=semantique
    RSS https://liens.azqs.com/GeekNik/?searchtags=RSS
    ical https://liens.azqs.com/GeekNik/?searchtags=ICAL
    Syndication https://liens.azqs.com/GeekNik/?searchtags=syndication


    # Voir aussi
    http://liens.azqs.com/azqs/?searchtags=agenda
    Sat Feb 25 18:59:58 2023 - permalink -
    - https://fr.wikipedia.org/wiki/ICalendar
    agenda calendrier Data DEV donnée ICAL Publish-subscribe semantique syndication sémantique temps
  • IPTC Information Interchange Model — Wikipédia
    L'Information Interchange Model (IIM) est une structure et un jeu d'attributs de métadonnées applicable à des fichiers texte, des images et d'autres types de média. Ce standard a été développé au début des années 1990 par le consortium International Press Telecommunications Council (IPTC) pour améliorer les échanges internationaux d'informations.
    - Extensible Metadata Platform ou XMP est un format de métadonnées basé sur XML utilisé dans les applications PDF, de photographie et de graphisme
    http://fr.wikipedia.org/wiki/Extensible_Metadata_Platform
    - Exchangeable image file format ou Exif est une spécification de format de fichier pour les images utilisées par les appareils photographiques numériques.
    http://fr.wikipedia.org/wiki/EXIF

    Et aussi
    - Metadonnées :http://fr.wikipedia.org/wiki/M%C3%A9tadonn%C3%A9es
    - Comprend officiellement 15 éléments de description formels (titre, créateur, éditeur), intellectuels (sujet, description, langue…) et relatifs à la propriété intellectuelle.
    http://fr.wikipedia.org/wiki/Dublin_Core
    Mon Feb 17 01:38:54 2014 - permalink -
    - http://fr.wikipedia.org/wiki/IPTC_Information_Interchange_Model
    bnb clef data DEV images img iptc jpg metadonnées mots photos png semantique sementique sémantique texte txt
Links per page: 20 50 100
page 1 / 1
Shaarli 0.0.41 beta - The personal, minimalist, super-fast, no-database delicious clone. By sebsauvage.net. Theme by idleman.fr.