Connectix Boards
Bienvenue, vous n'êtes pas connecté. ( Se connecter - S'enregistrer )
Dernière version sortie: 0.8.4!
Venez tester la version 1.0 beta
Connectix Boards > Zone développement > Programmation > [MOD] Reconnaissance des Robots
| KaNa | #1 18/04/2010 - 18h30 |
|
Groupe : Habitué Hors ligne Site Web |
Nom du mod : Reconnaissance des Robots
Auteur : KaNa Date de création : 18 Avril 2010 dernière mise à jour : 19 Avril 2010 Version de CB : 0.8.4 versions inférieures non testées Aperçu du rendu ![]() Description générale : Le mod "Reconnaissance des Robotst" permet de voir les robots présents sur votre forum, et au même titre que les utilisateurs, de voir ce qu'ils font. Liste des robots connus : 'Googlebot' => 'Robot Google', 'ia_archiver' => 'Robot Alexa', 'fastcrawler' => 'Robot Lycos', 'Slurp' => 'Robot Yahoo', 'msnbot/' => 'Robot MSN', 'Scooter/' => 'Robot Altavista', 'ArchitextSpider' => 'Robot Excite', 'ArchitectSpider' => 'Robot Excite', 'VoilaBot' => 'Robot Voilà', 'Exabot/' => 'Robot Exalead', 'Gigabot/' => 'Robot Gigablast', 'Mercator' => 'Robot Altavista', 'Googlebot-Image' => 'Robot Google-Image', 'DeepIndex' => 'Robot de Deepindex', 'FAST-WebCrawler' => 'Robot de FAST', 'Ask Jeeves' => 'Robot Ask Jeeves', 'Teoma' => 'Robot de Teoma', 'Pompos' => 'Robot de Pompos', 'ZyBorg' => 'Robot de Wizenut', 'HenriLeRobotMirago' => 'Robot de Mirago', 'Openbot' => 'Robot de Openfind', 'Mediapartners-Google' => 'Robot Adsense', 'NG' => 'Robot Aol', 'AdsBot-Google' => 'Robot Google AdsBot', 'Baiduspider+' => 'Robot Baidu', 'FAST Enterprise Crawler' => 'Robot FAST Enterprise', 'FAST WebCrawler/' => 'Robot FAST WebCrawler', 'www.neomo.de' => 'Robot Neomo', 'Google Desktop' => 'Robot Google Desktop', 'Feedfetcher-Google' => 'Robot Google Feedfetcher', 'heise-IT-Markt-Crawler' => 'Robot Heise IT-Markt', 'heritrix/1.' => 'Robot Heritrix', 'ibm.com/cs/crawler' => 'Robot IBM Research', 'ICCrawler - ICjobs' => 'Robot ICCrawler/ICjobs', 'ichiro/' => 'Robot Ichiro', 'MJ12bot/' => 'Robot Majestic-12', 'MetagerBot/' => 'Robot Metager', 'msnbot-NewsBlogs/' => 'Robot MSN NewsBlogss', 'msnbot-media/' => 'Robot MSN Media', 'NG-Search/' => 'Robot NG-Search', 'http://lucene.apache.org/nutch/' => 'Robot Nutch', 'NutchCVS/' => 'Robot Nutch/CVS', 'OmniExplorer_Bot/' => 'Robot OmniExplorer', 'online link validator' => 'Robot Online link', 'psbot/0' => 'Robot Picsearch', 'Seekbot/' => 'Robot Seekport', 'Sensis Web Crawler' => 'Robot Sensis', 'SEO search Crawler/' => 'Robot SEO Crawler', 'Seoma [SEO Crawler]' => 'Robot Seoma', 'SEOsearch/' => 'Robot SEOSearch', 'Snappy/1.1 ( http://www.urltrends.com/ )' => 'Robot Snappy', 'http://www.tkl.iis.u-tokyo.ac.jp/~crawler/' => 'Robot Steeler', 'SynooBot/' => 'Robot Synoo', 'crawleradmin.t-info@telekom.de' => 'Robot Telekom', 'TurnitinBot/' => 'Robot Turnitin', 'voyager/1.0' => 'Robot Voyager', 'W3 SiteSearch Crawler' => 'Robot W3 [Sitesearch]', 'W3C-checklink/' => 'Robot W3C [Linkcheck]', 'W3C_*Validator' => 'Robot W3C [Validator]', 'http://www.WISEnutbot.com' => 'Robot WiseNut', 'yacybot' => 'Robot YaCy', 'Yahoo-MMCrawler/' => 'Robot Yahoo MMCrawler', 'YahooSeeker/' => 'Robot YahooSeeker', Installation du MOD Modification de la base de donnée : Dans PhpMyAdmin, tapez la requête SQL suivante : ALTER TABLE `cb_connected` ADD `con_user_agent` VARCHAR( 255 ) NOT NULL AFTER `con_position` ;Modification des fichiers : *Dans include/core/class.user.php Cherchez : function connected ($position) {Et remplacez par cela : function connected ($position) {*Dans include/parts/part.general.php Cherchez : /* Affichage des utilisateurs connectés sur cette partie du site. */Et remplacez par cela : /* Affichage des utilisateurs connectés sur cette partie du site. */*Dans include/parts/part.connusers.php Cherchez : /* Moment d'exécution de la page... */Et remplacez par cela : /* Moment d'exécution de la page... */Cherchez : /* Affichage des utilisateurs */Et remplacez par cela : /* Affichage des utilisateurs */*Dans templates/Official/part.connusers.php Cherchez : <td class="ppl_name">Et remplacez par cela : <td class="ppl_name">Voilà, ce mod est près à l'utilisation. Mises à jour : 19/04/2010 : Modification de la liste des robots et de la façon dont on cherche les robots dans le fichiers class.user.php .
Ce message a été édité par KaNa le 19/04/2010 à 11h09.
Etudiant @ CPE Lyon
Administrateur de Webechange.org Nouveau site !!! Administrateur de NeXteam.net En préparation pour la V2.0 |
| kristoch | #2 18/04/2010 - 18h52 |
|
Groupe : Acharné Hors ligne Site Web |
c'est super mais ai du mal à comprendre le truc: ça reconnait les robots?!
mais ça va chercher où les adresses IP et l'identification? ça fonctionne comment ce truc? d'autre part comme il n'y a pas de capture pour voir, j'aimerais savoir s'ils sont distingués par une couleur et ce que ça donne quand on clique dessus comme on peut le faire pour les membres: rien? enfin tous les robots non spammeurs sont recensés, listés et reconnus? il n'en manque aucun? merci d'avance pour toutes ces précisions!
un de mes blogs : chachacha
|
| KaNa | #3 18/04/2010 - 19h03 |
|
Groupe : Habitué Hors ligne Site Web |
Alors, comment ça reconnait les robots ? Par leur HTTP_USER_AGENT (celle identifie le navigateur de l'utilisateur, et c'est donc avec ça que l'on voit de quel robot il s'agit ) avec cette ligne : preg_match( '/(googlebot|ia_archiver|Lycos_Spider_(T-Rex)|Slurp|msnbot|Scooter|ArchitextSpider|ArchitectSpider|VoilaBot|Exabot|Gigabot|Mercator|Googlebot-Image|DeepIndex|FAST-WebCrawler|Ask Jeeves|Teoma|Pompos|ZyBorg|HenriLeRobotMirago|Openbot|Mediapartners-Google|NG)/i', $_SERVER['HTTP_USER_AGENT'], $match ) )J'ai mis des captures, pour voir le rendu. Pour le moment, la couleur des robots et la même que celle des invités, si tu veux modifier la couleur il faut modifier cette ligne dans templates/Official/part.connusers.php :
En rouge ici, on affiche le nom du Robot, donc si tu veux lui mettre une couleur il suffit de mettre autour une balise span avec une couleur que tu choisis. Pour ceux qui est de la liste, je ne sais pas si elle est à jour, je me suis servis d'une présente sur Internet, mais si quelqu'un en trouve une récente j'apporterai les modifications .Cordialement, KaNa.
Ce message a été édité par KaNa le 18/04/2010 à 19h23.
Etudiant @ CPE Lyon
Administrateur de Webechange.org Nouveau site !!! Administrateur de NeXteam.net En préparation pour la V2.0 |
| Ishimaru Chiaki | #4 18/04/2010 - 23h04 |
|
Groupe : Doc-rédacteur Hors ligne Site Web |
Pour la liste des robots de moteurs de recherche, j'ai un phpBB3 en local et les user agent des robots sont stockés dans une table. Voici le contenu de ma table :
-- phpMyAdmin SQL Dump
Besoin de volontaires pour les tests du support IPv6 dans la future version 0.8.5 !
Plus d'informations ici Mon fil Twitter |
| KaNa | #5 19/04/2010 - 02h35 |
|
Groupe : Habitué Hors ligne Site Web |
Merci à toi Ishimaru Chiaki, je mettrais le code à jour dans la semaine
.Bien sur, j'ai proposé cette manière de procéder, mais si quelqu'un en voit une plus simple, je suis pas contre .
Etudiant @ CPE Lyon
Administrateur de Webechange.org Nouveau site !!! Administrateur de NeXteam.net En préparation pour la V2.0 |
| Jeff | #6 19/04/2010 - 09h10 |
|
Groupe : Habitué Hors ligne |
Un petit constat fait la semaine passée sur les stats de mon FAI, j'ai environ une dizaine de bots provenant d'adresses .ru, .cn, un .gr ainsi qu'un en .it.
Je crois que les listes de bots ne peuvent plus être mis à jour tant il y en a qui apparaissent chaques jours et il y en a des violents... ![]() Une liste non exhaustive trouvée sur le net : A AbiLogic Accoona AdSense aipbot Alexa almaden AOL France appie Ask Jeeves ASPseek B Baidu baiduspider BecomeBot Bloglines BlogPulse Boitho btbot Burf.com C Camcrawler Camdiscover Cerberian cfetch Charlotte CheckWeb Combine Cosmix cuill.com D DataCha0s DataparkSearch dir.com DTS Agent E e-SocietyRobot Enfin Everbee exabot Exabot-Images Exalead F Fast Search Filangy Findexa FindLinks FURL G genieBot Gigablast gigabot Girafa Google AdSense Google Image Googlebot Googlebot-Image Gossamer Links grub H Healthline HenryTheMiragoRobot Heritrix I ia_archiver IBM WebFountain ichiro Ipselon ipselonbot IRL crawler IRLbot J Java Jeeves K Kavam Kosmix Krugle L Lapozz Larbin Link Valet LinkChecker LinksManager linksmanager_bot LinkWalker Local.com LocalcomBot LookSmart LOOP Improvements Lycos Spider M Majestic-12 Mediapartners-Google* MetaWeb Crawler Mirago Misterbot MJ12bot MMCrawler mnoGoSearch MojeekBot msnbot MSNPTC MSRA MSRBot Mylinea N NaverBot NetResearchServer Nexen NextGenSearchBot NG NimbleCrawler Norbert noXtrum Nusearch Nutch O Omni-Explorer OnetSzukaj oo-x Orangeslicer Orbiter Oxado P PeerFactor PHP version tracker Picsearch Plantynet pmafind pompos Poodle psbot psycheclone Q QweeryBot R Rambler RedKernel Rufus Web Miner S SAGOOL SandCrawler SBIder Scirus Searchmee SearchSerf Secure Computing seekbot Seekport sensis.com.au Shim-Crawler ShopWiki Singingfish SiteSell.com Slurp snafu Snapbot SoGou SOHU.com Sproose SquidClamAV StackRambler SurveyBot SygolBot T Teoma tilman TLink TMCrawler Turnitin Twiceler U Ulysseek V Vagabondo Voila Voyager W Wadaino Walhello WebFilter WebFountain Whois Source WinkBot WiseNut WorldIndexer wwwster WyseGuys X Xenu Y Y!J-BSC YaCy Yahoo! Slurp Yahoo-Blogs Yahoo-MMCrawler Z Zeusbot ZoomInfo ZyBorg
Ce message a été édité par Jeff le 19/04/2010 à 09h17.
|
| KaNa | #7 19/04/2010 - 10h16 |
|
Groupe : Habitué Hors ligne Site Web |
Voilà, j'ai mis à jour la liste comme j'ai pu, j'ai vu ce matin sur mon site le Robot Aol, Adsense et Yahoo! .
Ce message a été édité par KaNa le 19/04/2010 à 11h40.
Etudiant @ CPE Lyon
Administrateur de Webechange.org Nouveau site !!! Administrateur de NeXteam.net En préparation pour la V2.0 |
Connectix Boards > Zone développement > Programmation > [MOD] Reconnaissance des Robots
> Informations du forum
1 personne(s) présente(s) durant une période de 15 minutes (0 membre(s) et 1 invité(s)).
Powered by Connectix Boards 0.8.4 © 2005-2012 (8 queries, 0.103 sec)


.