Shaare your links...
385 links
Filou GeekNik : Sécurité / libre / p2P / réseaux / bidouilles / no net / etc Home Login RSS Feed ATOM Feed Tag cloud Picture wall Daily
Links per page: 20 50 100
page 1 / 1
5 results for tags scraping x
  • YouTube thumbnail
    vidéo scraping + automatisation
    https://www.youtube.com/watch?v=Ivp5PGIbGMw (Comment extraire les données d'un site web pour en faire un Assistant IA)
    https://www.youtube.com/watch?v=Wvc2ZqdIPpk (Apprendre le Web Scraping avec Python Français - Partie 1)
    https://www.youtube.com/watch?v=-3lqUHeZs_0

    https://www.mediatheques.strasbourg.eu/Default/doc/SKILLEOS/1494/python-apis-et-web-scraping-initiez-vous-aux-bases-du-scraping-sur-apis-et-sur-des-sites-web
    (python / api scraping / Scraping)

    https://www.youtube.com/watch?v=y3qNa73i-1A (J'ai crée un bot pour scraper Google + nettoyer / classifier les données avec l'IA)
    parle de  site de scraping
    SerpAPI 👉 https://serpapi.com/
    Piloterr 👉 https://www.piloterr.com/library/goog...
    Autom 👉 https://www.autom.dev/
    + automation Make

    https://www.youtube.com/watch?v=ZmtSfognYus (J’AI CRÉÉ UN BOT TINDER ! ) - infos :
    Navigateurs programmables >  https://www.selenium.dev/ et puppeteer https://deux.io/web-scraping-puppeteer/  https://github.com/puppeteer


    https://www.youtube.com/watch?v=4lkWl6NL2wg (J'ai codé une IA bot tinder)
    sous Andoid : adb (bach) +appium (https://fr.wikipedia.org/wiki/Appium - https://github.com/appium/appium )

    https://www.mediatheques.strasbourg.eu/SearchMinify/c5e86d9977e455300c600d88223d29b5 Python : APIs et Web Scraping - Initiez-vous aux bases du scraping sur APIs et sur des sites web
    Mon 11 Nov 2024 10:14:14 PM CET - permalink -
    - https://www.youtube.com/watch?v=Ivp5PGIbGMw
    aspiration automatisation bot DEV internet navigateur scraping tuto vidéo
  • scraping : pluging navigateurs et autres logiciels
    Voir aussi
    https://addons.mozilla.org/fr/firefox/search/?q=webscraper
    https://www.w3.org/TR/xpath-10/

    #Logiciels
    https://packagist.org/?query=scraping
    https://github.com/rakot/DataScrapper
    https://github.com/search?q=scraping&type=repositories
    https://electroniqueamateur.blogspot.com/2022/08/raspberry-pi-pico-w-lire-le-contenu.html  La bibliothèque "urequests" de Micropython
    https://github.com/FreshRSS/FreshRSS/discussions/4647

    https://fr.wikipedia.org/wiki/HTTrack
    https://launchpad.net/httraqt
    http://www.httrack.com/
    https://toot.aquilenet.fr/@arn_fai/112495254096961833

    https://github.com/aaronsw/html2text/

    ##Autres

    https://fr.wikipedia.org/wiki/Capture_de_donn%C3%A9es_d%27%C3%A9cran
    https://www.octoparse.fr/blog/top-30-des-logiciels-de-web-scraping-gratuits-en-2021
    https://duckduckgo.com/?q=otum+scraping

    #plateforme

    https://webscraper.io/
    https://korben.info/site-na-pas-flux-rss-voici-comment-en-faire.html
    https://www.growthhacking.fr/c/scraping/8
    https://www.leptidigital.fr/growth-hacking/logiciels-scraping-61517/


    # Voir aussi le no code/api
    https://browser-automation-studio.com/  ( outil d'automatisation  tournant en local)
    https://alternativeto.net/software/browserautomationstudio/
    https://www.youtube.com/watch?v=Fxp3U4Rbo0A
    https://www.youtube.com/@DEW-Automatisation
    http://liens.azqs.com/GeekNik/?searchtags=nocode#kReZmw


    # Concepts proches concernant la captation de données

    https://liens.azqs.com/GeekNik/?searchtags=osint
    Scraping (extraction de données) https://liens.azqs.com/GeekNik/?searchtags=scraping
    http://liens.azqs.com/GeekNik/?searchtags=nocode

    Fediverse : https://liens.azqs.com/GeekNik/?searchtags=fediverse
    Mqqt (internet des objets - iot) https://liens.azqs.com/GeekNik/?searchtags=mqtt
    API :  https://liens.azqs.com/GeekNik/?searchtags=api
    Web Sémantique (RDF - XML - URI - OWL -  DocBook - GML - ...)  https://liens.azqs.com/GeekNik/?searchtags=semantique
    RSS https://liens.azqs.com/GeekNik/?searchtags=RSS
    ical https://liens.azqs.com/GeekNik/?searchtags=ICAL
    https://fr.wikipedia.org/wiki/Web_des_objets#Web_social
    Mon 11 Nov 2024 08:35:13 PM CET - permalink -
    - https://addons.mozilla.org/fr/firefox/search/?q=webscraper
    aspiration copie DEV logiciel scraping web
  • Recueillir des données sur le Web - Guide du datajournalisme
    << parle des extensions :   Readability > permet d’extraire manuellement le texte d’une page web et du concept général
    et aussi
    https://wydden.com/10-outils-pour-scraper-des-donnees-sans-coder-ou-presque/ (services en ligne, plugin, cadriciel)

    # Web_scraping
    https://fr.wikipedia.org/wiki/Web_scraping

    # Solutions / cadriciels
    https://fr.wikipedia.org/wiki/Scrapy (ligne de commande et Phyton) https://github.com/scrapy/scrapy
    https://fr.wikipedia.org/wiki/Weboob (sites préréglés) http://weboob.org/modules http://planet.weboob.org/

    https://linuxfr.org/news/weboob-sort-une-nouvelle-version-qui-va-vous-porter-chance
    https://linuxfr.org/news/weboob-une-version-1-1-pour-son-sixieme-anniversaire
    https://linuxfr.org/news/weboob-sort-une-nouvelle-version-qui-va-vous-porter-chance
    https://www.pycon.fr/2017/programme.html#la-puissance-du-scraping-web-avec-weboob
    https://www.pycon.fr/2017/programme.html#weboob-le-navigatueur

    L'utilisateur qui cherche une boîte à outils s'oriente vers scrapy, et celui que veut du clé-en-main va vers weboob.
    https://linuxfr.org/users/lebouquetin/journaux/extraction-de-donnees-du-web-introduction-a-scrapy-journal-bookmark (parle des deux dans les commentaires, Tuto, XPATH )
    https://linuxfr.org/users/lebouquetin/journaux/pyjobs-un-job-board-pour-les-agreger-tous
    https://fr.wikipedia.org/wiki/XPath (langage d'exploration)

    https://fr.wikipedia.org/wiki/OutWit_Hub
    https://pypi.org/project/scraperwiki/
    https://pypi.org/user/scraperwiki/ (service en ligne uniquement ?)

    # Navigateur web sans tête (sans interface graphique) scriptable utilisé pour automatiser des interactions avec des pages web
    https://fr.wikipedia.org/wiki/Navigateur_sans_t%C3%AAte
    https://fr.wikipedia.org/wiki/PhantomJS Le projet est abandonné en  2017 du fait de l'ajout du mode sans tête dans Chrome 59 et 60.
    https://developer.mozilla.org/fr/docs/Mozilla/Firefox/Headless_mode

    https://www.youtube.com/watch?v=JvaQ7kS2hEM&t=197s
    https://www.automation-facile.fr/

    https://fr.wikipedia.org/wiki/Selenium_(informatique)
    https://en.wikipedia.org/wiki/Katalon_Studio https://github.com/katalon-studio
    https://en.wikipedia.org/wiki/Comparison_of_GUI_testing_tools

    # Extension navigateur
    https://addons.mozilla.org/fr/firefox/search/?platform=Linux&q=Scraper&sort=users&type=extension
    https://addons.mozilla.org/fr/firefox/addon/web-scraper (c'est aussi un service en ligne)
    https://addons.mozilla.org/fr/firefox/addon/datascraper/
    https://data-miner.io/ (Chrome)


    # Autres
    https://pypi.org/search/?q=scrap
    https://pypi.org/search/?q=scrappe
    https://pypi.org/search/?q=scrapper
    https://pypi.org/search/?q=scraping
    https://pypi.org/search/?q=scrapping

    https://gitlab.com/search?search=scrap
    https://gitlab.com/search?search=scrappe
    https://gitlab.com/search?search=scrapper
    https://gitlab.com/search?search=scraping
    https://gitlab.com/search?search=scrapping

    https://korben.info/extraire-des-donnees-structurees-partir-dun-pdf.html
    https://fr.wikipedia.org/wiki/Aspirateur_de_site_web
    https://fr.wikipedia.org/wiki/HTTrack
    https://github.com/OWASP/Amass (liste les adresses d'un site)
    Wed 20 Sep 2023 09:08:08 PM CEST - permalink -
    - http://jplusplus.github.io/guide-du-datajournalisme/pages/0504.html
    aspiration automatisation data DEV extraction harvesting information journalisme mining navigateur osint scraping semantique service SITE sémantique web
  • Zone d'Intérêt: Hérisson et OSINT
    La DGA confirme le développement d'un démonstrateur technologique visant à la collecte d'informations numériques en sources ouvertes.

    #Autres sources
    http://ecrans.liberation.fr/ecrans/2009/03/23/herisson-n-a-rien-a-voir-avec-le-systeme-echelon_950314
    http://www.nextinpact.com/archive/49822-systeme-herisson-surveillance-dga-echelon.htm
    https://mazzhe.wordpress.com/tag/herisson/
    http://probe.20minutes-blogs.fr/archive/2009/06/27/herisson-attack-2.html

    Exemple (maj 2025)
    https://secoursrouge.org/etats-unis-ia-la-police-capable-de-geolocaliser-nimporte-quelle-photo/
    Tue 10 Mar 2015 12:04:32 AM CET - permalink -
    - http://zonedinteret.blogspot.fr/2009/04/herisson-et-osint.html
    analyse armement bigdata dga extraction identification osint scraping surveillance veille videosurveillance vidéo
  • LNE: Présentation
    Le DEFI-REPERE est un projet d'évaluations dans le domaine de la reconnaissance multimédia de personnes dans des documents télévisuels. D'une durée de 42 mois il est financé par la DGA.
    http://www.agence-nationale-recherche.fr/suivi-bilan/historique-des-appels-a-projets/appel-detail1/programme-contenus-et-interactions-defi-multimedia-reconnaissance-de-personnes-dans-des-emissions-audiovisuelles-repere-2010/
    Labos :
    SODA/sylvain Meigner/U du Maine le Mans
    Qompere, Claude Barras, U Orsay
    Percol, Fréderic Béchet, U Aix Marseille

    Contrôle qualité : Labo Nat métrologie et essais  Juliette Kahn

    Source de l'info Science et Avenir Num : 797 Juillet 2013

    Et aussi :
    http://www.futura-sciences.com/magazines/high-tech/infos/actu/d/technologie-reconnaissance-faciale-1-seconde-reperer-visage-parmi-36-millions-38662/
    Wed 04 Mar 2015 01:56:40 AM CET - permalink -
    - http://www.defi-repere.fr/
    analyse anr armement dga extraction identification osint reconnaissance scraping surveillance vidéo vidéosurveillance
Links per page: 20 50 100
page 1 / 1
Shaarli 0.0.41 beta - The personal, minimalist, super-fast, no-database delicious clone. By sebsauvage.net. Theme by idleman.fr.