Filou GeekNik : Sécurité / libre / p2P / réseaux / bidouilles / no net / etc

Shaare your links...
407 links

Filou GeekNik : Sécurité / libre / p2P / réseaux / bidouilles / no net / etc Home Login RSS Feed ATOM Feed Tag cloud Picture wall Daily

Links per page: 20 50 100

page 1 / 1

5 results for tags scraping x

vidéo scraping + automatisation

https://www.youtube.com/watch?v=Ivp5PGIbGMw (Comment extraire les données d'un site web pour en faire un Assistant IA)
https://www.youtube.com/watch?v=Wvc2ZqdIPpk (Apprendre le Web Scraping avec Python Français - Partie 1)
https://www.youtube.com/watch?v=-3lqUHeZs_0

https://www.mediatheques.strasbourg.eu/Default/doc/SKILLEOS/1494/python-apis-et-web-scraping-initiez-vous-aux-bases-du-scraping-sur-apis-et-sur-des-sites-web
(python / api scraping / Scraping)

https://www.youtube.com/watch?v=y3qNa73i-1A (J'ai crée un bot pour scraper Google + nettoyer / classifier les données avec l'IA)
parle de site de scraping
SerpAPI 👉 https://serpapi.com/
Piloterr 👉 https://www.piloterr.com/library/goog...
Autom 👉 https://www.autom.dev/
+ automation Make

https://www.youtube.com/watch?v=ZmtSfognYus (J’AI CRÉÉ UN BOT TINDER ! ) - infos :
Navigateurs programmables > https://www.selenium.dev/ et puppeteer https://deux.io/web-scraping-puppeteer/ https://github.com/puppeteer

https://www.youtube.com/watch?v=4lkWl6NL2wg (J'ai codé une IA bot tinder)
sous Andoid : adb (bach) +appium (https://fr.wikipedia.org/wiki/Appium - https://github.com/appium/appium )

https://www.mediatheques.strasbourg.eu/SearchMinify/c5e86d9977e455300c600d88223d29b5 Python : APIs et Web Scraping - Initiez-vous aux bases du scraping sur APIs et sur des sites web
Mon 11 Nov 2024 10:14:14 PM CET - permalink -
- https://www.youtube.com/watch?v=Ivp5PGIbGMw

aspiration automatisation bot DEV internet navigateur scraping tuto vidéo
scraping : pluging navigateurs et autres logiciels

Voir aussi
https://addons.mozilla.org/fr/firefox/search/?q=webscraper
https://www.w3.org/TR/xpath-10/

#Logiciels
https://packagist.org/?query=scraping
https://github.com/rakot/DataScrapper
https://github.com/search?q=scraping&type=repositories
https://electroniqueamateur.blogspot.com/2022/08/raspberry-pi-pico-w-lire-le-contenu.html La bibliothèque "urequests" de Micropython
https://github.com/FreshRSS/FreshRSS/discussions/4647

https://fr.wikipedia.org/wiki/HTTrack
https://launchpad.net/httraqt
http://www.httrack.com/
https://toot.aquilenet.fr/@arn_fai/112495254096961833

https://github.com/aaronsw/html2text/

##Autres

https://fr.wikipedia.org/wiki/Capture_de_donn%C3%A9es_d%27%C3%A9cran
https://www.octoparse.fr/blog/top-30-des-logiciels-de-web-scraping-gratuits-en-2021
https://duckduckgo.com/?q=otum+scraping

#plateforme

https://webscraper.io/
https://korben.info/site-na-pas-flux-rss-voici-comment-en-faire.html
https://www.growthhacking.fr/c/scraping/8
https://www.leptidigital.fr/growth-hacking/logiciels-scraping-61517/

# Voir aussi le no code/api
https://browser-automation-studio.com/ ( outil d'automatisation tournant en local)
https://alternativeto.net/software/browserautomationstudio/
https://www.youtube.com/watch?v=Fxp3U4Rbo0A
https://www.youtube.com/@DEW-Automatisation
http://liens.azqs.com/GeekNik/?searchtags=nocode#kReZmw

# Concepts proches concernant la captation de données

https://liens.azqs.com/GeekNik/?searchtags=osint
Scraping (extraction de données) https://liens.azqs.com/GeekNik/?searchtags=scraping
http://liens.azqs.com/GeekNik/?searchtags=nocode

Fediverse : https://liens.azqs.com/GeekNik/?searchtags=fediverse
Mqqt (internet des objets - iot) https://liens.azqs.com/GeekNik/?searchtags=mqtt
API : https://liens.azqs.com/GeekNik/?searchtags=api
Web Sémantique (RDF - XML - URI - OWL - DocBook - GML - ...) https://liens.azqs.com/GeekNik/?searchtags=semantique
RSS https://liens.azqs.com/GeekNik/?searchtags=RSS
ical https://liens.azqs.com/GeekNik/?searchtags=ICAL
https://fr.wikipedia.org/wiki/Web_des_objets#Web_social
Mon 11 Nov 2024 08:35:13 PM CET - permalink -
- https://addons.mozilla.org/fr/firefox/search/?q=webscraper

aspiration copie DEV logiciel scraping web
Recueillir des données sur le Web - Guide du datajournalisme

<< parle des extensions : Readability > permet d’extraire manuellement le texte d’une page web et du concept général
et aussi
https://wydden.com/10-outils-pour-scraper-des-donnees-sans-coder-ou-presque/ (services en ligne, plugin, cadriciel)

# Web_scraping
https://fr.wikipedia.org/wiki/Web_scraping

# Solutions / cadriciels
https://fr.wikipedia.org/wiki/Scrapy (ligne de commande et Phyton) https://github.com/scrapy/scrapy
https://fr.wikipedia.org/wiki/Weboob (sites préréglés) http://weboob.org/modules http://planet.weboob.org/

https://linuxfr.org/news/weboob-sort-une-nouvelle-version-qui-va-vous-porter-chance
https://linuxfr.org/news/weboob-une-version-1-1-pour-son-sixieme-anniversaire
https://linuxfr.org/news/weboob-sort-une-nouvelle-version-qui-va-vous-porter-chance
https://www.pycon.fr/2017/programme.html#la-puissance-du-scraping-web-avec-weboob
https://www.pycon.fr/2017/programme.html#weboob-le-navigatueur

L'utilisateur qui cherche une boîte à outils s'oriente vers scrapy, et celui que veut du clé-en-main va vers weboob.
https://linuxfr.org/users/lebouquetin/journaux/extraction-de-donnees-du-web-introduction-a-scrapy-journal-bookmark (parle des deux dans les commentaires, Tuto, XPATH )
https://linuxfr.org/users/lebouquetin/journaux/pyjobs-un-job-board-pour-les-agreger-tous
https://fr.wikipedia.org/wiki/XPath (langage d'exploration)

https://fr.wikipedia.org/wiki/OutWit_Hub
https://pypi.org/project/scraperwiki/
https://pypi.org/user/scraperwiki/ (service en ligne uniquement ?)

# Navigateur web sans tête (sans interface graphique) scriptable utilisé pour automatiser des interactions avec des pages web
https://fr.wikipedia.org/wiki/Navigateur_sans_t%C3%AAte
https://fr.wikipedia.org/wiki/PhantomJS Le projet est abandonné en 2017 du fait de l'ajout du mode sans tête dans Chrome 59 et 60.
https://developer.mozilla.org/fr/docs/Mozilla/Firefox/Headless_mode

https://www.youtube.com/watch?v=JvaQ7kS2hEM&t=197s
https://www.automation-facile.fr/

https://fr.wikipedia.org/wiki/Selenium_(informatique)
https://en.wikipedia.org/wiki/Katalon_Studio https://github.com/katalon-studio
https://en.wikipedia.org/wiki/Comparison_of_GUI_testing_tools

# Extension navigateur
https://addons.mozilla.org/fr/firefox/search/?platform=Linux&q=Scraper&sort=users&type=extension
https://addons.mozilla.org/fr/firefox/addon/web-scraper (c'est aussi un service en ligne)
https://addons.mozilla.org/fr/firefox/addon/datascraper/
https://data-miner.io/ (Chrome)

# Autres
https://pypi.org/search/?q=scrap
https://pypi.org/search/?q=scrappe
https://pypi.org/search/?q=scrapper
https://pypi.org/search/?q=scraping
https://pypi.org/search/?q=scrapping

https://gitlab.com/search?search=scrap
https://gitlab.com/search?search=scrappe
https://gitlab.com/search?search=scrapper
https://gitlab.com/search?search=scraping
https://gitlab.com/search?search=scrapping

https://korben.info/extraire-des-donnees-structurees-partir-dun-pdf.html
https://fr.wikipedia.org/wiki/Aspirateur_de_site_web
https://fr.wikipedia.org/wiki/HTTrack
https://github.com/OWASP/Amass (liste les adresses d'un site)
Wed 20 Sep 2023 09:08:08 PM CEST - permalink -
- http://jplusplus.github.io/guide-du-datajournalisme/pages/0504.html

aspiration automatisation data DEV extraction harvesting information journalisme mining navigateur osint scraping semantique service SITE sémantique web
Zone d'Intérêt: Hérisson et OSINT

La DGA confirme le développement d'un démonstrateur technologique visant à la collecte d'informations numériques en sources ouvertes.

#Autres sources
http://ecrans.liberation.fr/ecrans/2009/03/23/herisson-n-a-rien-a-voir-avec-le-systeme-echelon_950314
http://www.nextinpact.com/archive/49822-systeme-herisson-surveillance-dga-echelon.htm
https://mazzhe.wordpress.com/tag/herisson/
http://probe.20minutes-blogs.fr/archive/2009/06/27/herisson-attack-2.html

Exemple (maj 2025)
https://secoursrouge.org/etats-unis-ia-la-police-capable-de-geolocaliser-nimporte-quelle-photo/
Tue 10 Mar 2015 12:04:32 AM CET - permalink -
- http://zonedinteret.blogspot.fr/2009/04/herisson-et-osint.html

analyse armement bigdata dga extraction identification osint scraping surveillance veille videosurveillance vidéo
LNE: Présentation

Le DEFI-REPERE est un projet d'évaluations dans le domaine de la reconnaissance multimédia de personnes dans des documents télévisuels. D'une durée de 42 mois il est financé par la DGA.
http://www.agence-nationale-recherche.fr/suivi-bilan/historique-des-appels-a-projets/appel-detail1/programme-contenus-et-interactions-defi-multimedia-reconnaissance-de-personnes-dans-des-emissions-audiovisuelles-repere-2010/
Labos :
SODA/sylvain Meigner/U du Maine le Mans
Qompere, Claude Barras, U Orsay
Percol, Fréderic Béchet, U Aix Marseille

Contrôle qualité : Labo Nat métrologie et essais Juliette Kahn

Source de l'info Science et Avenir Num : 797 Juillet 2013

Et aussi :
http://www.futura-sciences.com/magazines/high-tech/infos/actu/d/technologie-reconnaissance-faciale-1-seconde-reperer-visage-parmi-36-millions-38662/
Wed 04 Mar 2015 01:56:40 AM CET - permalink -
- http://www.defi-repere.fr/

analyse anr armement dga extraction identification osint reconnaissance scraping surveillance vidéo vidéosurveillance

Links per page: 20 50 100

page 1 / 1