AUTOVEILLE
Logiciels d'automatisation de veille | Actualités 2012


Logiciel de veille automatique - Actualités 2012


Actualités 2012 : AUTOVEILLE - Veille stratégique automatisée

Les Actualités SEO et Veille 2016
Les Actualités SEO et Veille 2015
Les Actualités SEO et Veille 2014
Les Actualités SEO et Veille 2013
Les Actualités SEO et Veille 2012
Les Actualités SEO et Veille 2011

News du 30 décembre 2012,
Hello tout le monde !!
Bon décidément, je ne peux pas me séparer de mon ordinateur (même quand je suis malade, je fais du SEO !) hahahaha
Je vais vous parler très rapidement d'un mini outil que j'ai développé pour le content spinning. Le content spinning est le fait de dupliquer automatiquement un article en plusieurs autres articles grâce à des substituts et des synonymes.
Pour le faire, certains référenceurs ou webmasters utilisent des outils en php pour le faire, mais j'ai trouvé et développé un petit outil de content spinning avec du Perl et du Shell (bash).
C'est assez simple, je vous donne une petite idée des lignes de commandes pouvant modifier un texte en plusieurs autres textes rien que grâce à du grep et du sed :).
En Perl, un petit outil de content spinning se développe en 10 ~ 15 minutes à peu près.

egrep -w "(chat|chien)" fic.txt

sed 's/(chat|chien)/tortue/g' fic.txt

Rien que ces deux lignes de commandes shell permet de rechercher et de substituer "chat", "chien" par "tortue" par exemple.
Si vous êtes intéressé par cet outil content spinning, contactez-moi, je vous donnerai un exemple concret.
Cet outil est robuste, adaptable, personnalisable à l'infini. Il sera développé en Perl (ou directement traité en Shell) sur demande (ou commande :p) et je l'adapterai selon vos problèmatiques et à vos besoins, bien sûr.

Sur ce, je vous laisse, et je vous souhaite un excellent réveillon pour accueillir l'année 2013 comme il se le doit !
A 2013 (pour de bon !)
Bonne Année !!

News du 26 décembre 2012,
Me voilà de retour ... haha ! Je disais dans la news précédente que je ne reviendrais pas avant 2013, bah c'est impossible pour une geek comme moi de ne pas toucher à mon ordinateur, vous l'auriez bien compris ;) !
Ces derniers jours, j'ai pas mal travaillé sur l'optimisation du référencement naturel de mon site Autoveille.
J'ai ajouté une nouvelle rubrique en optimisant mots-clés, pages, et balises HTML, en ajoutant comme d'habitude des news pour dynamiser le contenu, en vérifiant la position du site par rapport à certains mots-clés sur lesquels je veux me positionner, en vérifiant si Googlebot (le crawler de Google) est passé sur mes pages (et les modifitications ...), en lisant des articles sur le SEO (bah oui, soif d'apprendre), etc.

Et pour dynamiser encore plus le contenu, j'ai pensé à créer un nouvel espace "Echanges" sur ma page "Contact" pour que les internautes participent et réagissent aux contenus mon site en laissant un message. Créer en quelque sorte un livre d'or.
Parce que pour l'instant, mon site Autoveille n'est qu'un site d'informations.

Google Académie organise de nouvelles formations Google Adwords le 24 janvier 2013, et ce serait une nouvelle occasion pour mieux comprendre les fonctionnements d'une campagne SEM / SEA.
Je suis surtout intéressée pour travailler sur les mots-clés, sur du texte, sur le code HTML, sur les balises, sur les sitelinks, sur le netlinking, etc.
J'ai construit ce site en autoditacte, mais je ne fais aucun community management sur ce dernier. A part Twitter et Linkedin, mon site n'est pas présent sur les réseaux sociaux, et il s'en sort plutôt bien au niveau des SERP, et obtient des notes correcte lors des audits SEO (Woorank, SEO Validator).
Je suis positionnée 3eme dans la première page des SERP Google sur "outil constitution automatique corpus" ! Pour les internautes qui veulent construire un corpus le plus automatiquement possible, ils pourraient taper de nombreux mots-clés se rapprochant de celui-ci, et tomber sur mon site ;)))) !
Sinon, je suis positionnée 1ere dans la première page des SERP sur "logiciel d'automatisation de veille", "logiciel d'automatisation veille", "autoveille", 5e dans les SERP sur "logiciel veille automatique", et 7e sur "logiciel de veille automatique" (je parle toujours de la première page Google évidemment !).
Actuellement, je travaille sur les mots-clés de la longue traîne pour essayer de positionner mon site sur des expressions plus niches (sémantiquement parlant, cela veut dire des expressions auxquelles les autres n'y auront pas forcément pensé). Pour cela, il faut aller sur les forums, les blogs, construire une communauté avec une phraséologie et terminologie propre, faire une analyse sémantique des termes (wow du TAL :) !), et voir après cette analyse sémantique, quels sont les collocations / les cooccurents qui apparaissent souvent avec nos mots-clés ou nos expressions principales. Il faut alors prendre ces collocations et ces cooccurents, et les incorporer dans les mots-clés, dans le contenu textuel, etc.

Eh oui, c'est beaucoup beaucoup de travail tout ça ! Il faut parfois travailler en équipe sur le SEO pour réussir, mais on peut très bien y arriver seul(e) ! Patience et persévérance (et travail !!) = bonne équation.
Bon, je vais arrêter d'écrire parce que sinon Google va trop m'aimer (il aime le contenu textuel apparemment hahaha), et les autres vont me détester lol
Dans la prochaine news, je vais vous parler de community management (peut être ? :p)
Pour l'instant, j'attends que Googlebot passe (la dernière fois, il était passé le 17 décembre ...) ! Je pense qu'il est en vacances lui aussi ... il n'y a que moi qui travaille ou quoi ?? *joke*

Aller, à la prochaine !

News du 23 décembre 2012,
Ahhhh enfin les vacances ! M'enfin pas vraiment ... eh oui, je suis toujours en train de travailler soit sur les chaînes de traitements Perl, soit sur le SEO, soit sur les langues, soit ... bon, je vois, faut que je me repose !
Et ... j'ai enfin implémenté un nouvel outil simple et efficace pour constituer automatiquement des corpus (ou des référentiels) ! Rendez-vous tout de suite dans la nouvelle rubrique "Corpus automatique", vous y trouverez une description du nouvel outil, et surtout ... un exemple pour vous convaincre de la simplicité, de l'efficacité et de la robutesse de la chaîne de traitements !

Par rapport au SEO, je m'intéresse actuellement à l'optimisation des balises, au ratio text/code, à la structure du HTML, des choses assez classiques, mais que tout le monde ne respecte pas ! (oui oui, en faisant des audits SEO pour certains sites, je vois que beaucoup sont faits pour avoir un beau design, une belle ergonomie, mais pas optimiser pour le référencement naturel).
Certains sites ont une meta keywords hyper longue alors qu'elle ne sert plus à grand chose (!). D'autres ont un h1 avec une image à la place d'un texte optimisé (!!), ou encore d'autres sites sont statiques et ont peu de textes (!!!)
En ce moment, je souhaite élargir mes compétences au niveau des microdata SEO, de l'ergonomie, du trafic (netlinking), du community management.

Bon ... comme je vous le disais au début de cette news, je travaille sans cesse sur le Perl ou sur le SEO ou sur le HTML ... si je continue à parler, je ne vais plus m'arrêter. Je vais dessiner là ... (oui, je dessine des mangas aussi !!=))

Ayez la soif d'apprendre :D !

Bonnes fêtes !
A la prochaine ... en 2013 !(si je ne reviens pas avant ...)

News du 02 décembre 2012,
Bonjour à tous !!
Nous sommes déjà ... en décembre !!!
Vous vous rendez compte ?? L'année 2012 est presque passée en un clin d'oeil (pour moi en tout cas !)
Sinon, pour l'instant, ça avance correctement au niveau de la réalisation des divers référentiels réglementaires Tianjin, Xiamen et Hong Kong. Tous les trois sont réalisés à environ 60% ~ 70%.
Grâce à Autoveille, j'ai la base de tous les textes de lois existants en HSE pour ces divers pays / régions / villes.
A chaque fois qu'on me donne un nouveau pays à faire, c'est comme un nouveau défi ! Il faut que j'étudie la faisabilité, si mon outil d'extraction est adapté aux sites web du pays, etc. Et c'est très bien pour implémenter les chaînes de traitement que j'ai réalisés. J'ai créé et combiné des chaînes s'adaptant à différentes problèmatiques: veille automatique (collecte automatique), moteur de recherche, traduction automatique, extraction automatique de mails, etc.
Et c'est vraiment efficace pour faciliter la réalisation de tâches chronophages à basse valeur ajoutée.
Continuons sur cette voie, et keep on improving !! We can do it !!!!! (We can do what we want to do ;) Courage !)

A la prochaine,
@++

News du 18 novembre 2012,
Bonjour tout le monde !!
J'espère que vous allez bien malgré le temps glacial et pluvieux (qui donne envie de rien !!).
Mes collègues qui doivent partir en visite de sites industriels sont tous sur le départ ce week end !
Les destinations sont les suivantes: Chine, Hong Kong, Malaisie, Singapour, Australie, Angleterre et Ecosse ! WOW de beaux pays dans l'ensemble :))))
Je leurs souhaite tous un très bon voyage (s'ils me lisent ...)
J'ai pas mal coaché mon collègue qui part en Chine et Hong Kong sur les cultures et les traditions, les choses à faire et à ne pas faire.
Il fera du Nord de la Chine au Sud de la Chine ! Toute la Chine en gros !! Et je peux vous dire que ce n'est pas les mêmes températures partout ! -20° au Nord ... et presque 30° au Sud !
Et pour la première fois ... j'ai envoyé des mails professionnels à 1h30 du matin ... (je sais, c'est chaud !)
Sinon, moi qui reste en France, je vais attaquer la constitution du référentiel de Hong Kong. Hong Kong est une région autonome spéciale qui a son propre gouvernement malgré la retrocession de 1997. Il fonctionne sous le système juridique anglais: le Common law et Case law systems.
Bon, pour constituer mon référentiel (en fait, c'est un corpus de textes) je vais utiliser ... AUTOVEILLE ! Bah oui, c'est son grand retour 2012 :D
Donc en premier, je dois récupérer tous les textes existants en droit HSE à Hong Kong pour travailler la partie base de textes de lois ("legal texts"). Pour cela mon outil de veille automatique ou plutôt outil de constitution de référentiel automatique est le bienvenu !!
Je ne me vois pas faire des copier / coller à la main T_T.
Ensuite, je dois, parmi ces textes, sélectionner ceux qui correspondent et s'appliquent aux activités du site industriel. Si le site ne veut pas le texte en entier, je devrais faire un tri des dispositions dans le texte et les affecter au site concerné. Voilà en résumé hyper méga rapide le travail que je dois faire dans les prochains jours ! (souhaitez moi bonne chance ...)
Et évidemment, je dois continuer à assurer la veille réglementaire HSE CHINE et la veille juridique HSE TAIWAN. Mais mon boss ne veut QUE du réglementaire ... donc je ne lui donne que du réglementaire maintenant (bah oui, avant je traitais aussi des communiqués sur la vie active des ministères, et non uniquement des communiqués portant sur les textes de lois) !
Ahhhhh sinon !! Par rapport au SEO ... faites gaffe aux mises à jour des algorithmes Google ! Si jamais votre site perd d'un coup en positionnement sans que vous ayez fait de changements majeurs ... well, take a look at the possible updates of Google algorithms !!
Il y en a eu récemment (septembre, octobre, novembre) en tout cas avec Panda, et autres.
Bon à l'avenir, je pense que mes news seront de plus en plus longues !! Mais je suis satisfaite, je vais travailler sur une région que j'aime bien: Hong Kong, et Autoveille fait son grand retour !!
Je vous laisse sur cette enthousiasme ...
A la prochaine :))))

News du 28 octobre 2012,
Helloooo !!!
Cela fait un peu plus d'un an que je travaille à Red on line maintenant ! Qu'est ce que le temps passe vite !
Entre le 15 septembre et le 28 octobre, il s'est passé pas mal de choses :))) ! Aller, c'est parti pour les news croustillantes !
Nous avons défini les dates pour les prochaines visites des sites industriels dans le monde entier. Etape qui a été complexe à réaliser par moment, nous y sommes arrivés !
Les visites se passeront entre le mois de novembre et le mois de décembre. Pendant deux / trois semaines, je pense que je serai la seule présente de mon équipe au bureau ... bah oui, il faut bien quelqu'un pour effectuer le travail, et l'envoi des news, etc.
Sinon, au niveau de l'automatisation de la veille, mise à part l'utilisation indispensable des flux RSS, j'ai découvert un outil de veille automatique qui répére les changements / les modifications des pages au niveau des pages HTML elles-mêmes. Donc avec cet outil, on ne passe pas par les flux RSS. Cela fait trois semaines que je le teste, et il marche bien. Je reçois tous les jours une alerte mail pour me prévenir quelles sont mes sources qui ont eu une modification.
Si vous souhaitez en savoir plus, veuillez me contacter directement. ;)))) (confidentialité oblige).

Au niveau du SEO ... il y a eu des changements aussi !! Notre chère responsable marketing qui travaillait sur le référencement naturel avec moi ... est partie pour des nouvelles aventures aux USA !! Du coup, nous avons recruté un nouveau responsable marketing qui prendra le relais de tout ce qu'elle faisait.
Avec le nouveau responsable, nous avons ensemble redéfini les points d'attaque du SEO (youhouuu).
- Revoir la structure des pages HTML du site vitrine: est ce que l'ordre des balises est bon (Hn > H1 -> H6)
- Travailler la liste des mots-clés de la longue-traîne: campagne Adwords, insertion de nouveaux mots-clés dans le contenu textuel du site vitrine
- Réaliser un blog dissocié du site vitrine pour augmenter le trafic des visiteurs: renforcement du community management auprès des réseaux sociaux via le blog
- Renforcer le maillage / le netlinking via les différents canaux présents sur le web jusqu'à notre site vitrine

Eh ben ! ça en fait du boulot :)))) Mais quand on aime et qu'on est intéressé, ce n'est que du bonheur !!
Ah sinon ... concernant Autoveille (bah oui, lui je ne peux pas l'oublier !!), je suis en train de réaliser une version plus ergonomique pour les futurs utilisateurs. Les changements ne sont pas nombreux à faire, mais il y en a à faire.

Voilà, voilà, on a à peu près fait le tour des news ! il y en a eu beaucoup en 1 mois et demi, vous ne trouvez pas ?! Bref, la vie continue :))))
A la prochaine !

News du 15 septembre 2012,
Helloooo !!
C'est la rentrée !! J'espère que vos vacances ont été bonnes si vous en avez eu !! Perso, moi je n'en ai pas eu.
Depuis le 22 juillet 2012, je ne vous ai pas donné de mes nouvelles ! Eh ben, je peux vous dire qu'il y en a au niveau professionnel
. Pour commencer, nous n'allons plus simplement travailler pour Hamilton, mais pour le groupe américain UTAS. Classe non ? Certes, mais nous allons passer de 15 sites industriels à 105 sites ... soit 10 fois plus pratiquement !
Et en plus de cela, nous sommes amenés à faire des visites de sites industriels à l'étranger (Chine, Singapour, Malaisie, UK, USA, Europe de l'Est, etc.) pour constituer des référentiels réglementaires.
Et je me pose une question: pendant que nous allons faire ces visites de sites ... comment va t-on s'occuper de la veille juridique en environnement et sécurité du travail de ces sites industriels ? Un gros casse-tête commence, je vous le dis ...
Ah sinon, sur la partie du référencement naturel, il y a des formations gratuites SEO données par Google Académie le 18 septembre, le 19 octobre, le 19 novembre et le 20 décembre !
Aller courage ! We can do it !!

A la prochaine news ... :)

News du 22 juillet 2012,
Bonjour à tous !
J'ai été récemment nommée chef de projet / responsable client BioMérieux (voir mon linkedin) ! Je suis contente de cela.
En me nommant responsable client, cela implique que j'aurais des tâches de plus en plus variées et ... nombreuses, bah oui!
Désormais, en plus de la veille réglementaire HSE Chine et Taïwan à faire, je dois gérer des sites espagnols et italiens.
Je suis satisfaite pour le moment. Et c'est le plus important.
Récemment, mes supérieurs m'ont fait une demande assez originale: trouver un moyen pour faire traduire automatiquement des pages web en langues étrangères (ukrainien, russe, italien, etc.) en anglais ou en français récoltées depuis un agrégateur de flux RSS pour une veille semi-automatique.
. Pour l'instant je propose deux solutions: le module ImTranslator de Firefox ou Google Translate
Avec Google Translate, la tâche serait plus manuelle, et avec ImTranslator, il suffir d'installer le module, faire click droit et entrer les données à traduire, et c'est ok.
Aller, courage !
A la prochaine news :)

News du 26 juin 2012,
Hello à tous !
Wow ! Cela fait un peu plus de deux mois que je n'ai pas touché à mon site web portant sur mon outil de veille automatique. Je viens de regardes les positionnements de mon site via SEO Soft, et ils sont plutôt bons !
Désormais, mon site se trouve en première page Google sur les mots-clés suivants
- "logiciel automatisation veille" - "logiciel d'automatisation de la veille" - "logiciel de veille automatique" - "logiciel veille automatique"

Aujourd'hui, avec la chef de projet marketing de ma boîte, nous sommes allées à une formation Google Adwords organisée par Google Académie. Je peux vous dire que nous n'avons pas été déçues !
C'est une formation d'une journée mais de qualité ! (avec buffet à volonté, etc. !! Qui dit mieux ??)
A part s'être empifrées, nous sommes ressorties de le crâne bourré d'informations et de techniques pour optimiser nos campagnes Adwords. J'ai parlé de ma formation en ingénierie linguistique à l'un des organisateurs de la formation, et il m'a dit que le référencement naturel (organique ou payant) était en effet parfaitement en corrélation avec la discipline !
Je peux vous dire que ça fait plaisir d'entendre ça, et qu'on ne me fait pas de gros yeux étonnés quand je dis que je suis "ingénieure linguiste" !
Voilà, voilà, mon site va évoluer (ou a déjà évolué) vers une perspective plus SEO, e-marketing ultérieurement !
Mais la veille stratégique assistée par ordinateur reste un domaine que je veux continuer à découvrir !!
Merci Google ...
A la prochaine news ;)

News du 22 avril 2012,
Bonjour !!
Une semaine de découvertes vient de s'écrouler !! Découvertes ? Lesquelles ?
Je ne savais pas que Google proposait des formations gratuites SEO. Je viens de le savoir par le biais de notre chef de projet marketing (merci Orangette :p)
En fait, ce sont plus des formation campagne adwords que des formations au SEO pures et dures.
On peut retrouver ces formations via ce lien Google Académie J'ai également effectué le référencement manuel de notre site vitrine, Red on line. Référencement manuel ?? Qu'est ce que c'est que cela ??
Définition de référencement manuel: Le référencement manuel est la soumission par l'homme d'un site dans les outils de recherche. Ce travail consiste à proposer un site en passant pas les rubriques de soumission propres à chaque outil de recherche. Cette technique de référencement est plus efficace que le référencement automatique. La soumission doit être accompagnée d'une optimisation pour que le site soit correctement positionné dans les outils de recherche.
Source: Définition de référencement manuel

Une prestation que l'on facture bien chère (dans les 400€ ...) pour ce que c'est.

Sinon, concernant la veille réglementaire HSE de cette semaine, j'ai produit 45 alertes et bulletins !! (chiffre énorme pour vous dire ... je ne sais pas ce qu'il s'est passé au niveau de la législation en Chine, et surtout ... je ne sais pas ce qu'il s'est passé avec ma tête, mon clavier et mes doigts !! 45 ... WOW !)
Bon sur ce, je vous dis à bientôt !
Speedy girl

News du 15 avril 2012,
Bonjour à tous !
Cela fait un an que je travaille (stage inclu) !! Une année hyper enrichissante.
Avec des hauts et des bas. Mais une chose est sûr, le monde du travail, ce n'est pas fait pour ceux qui croient au Père Noël ! haha
C'est surtout une année épuisante qui vient de passer. Mais je regrette absolument rien. Cette année m'a fait réaliser tellement de choses. Par exemple, j'aurais dû profiter de mes vacances universitaires hahaha.
Bref, revenons à la semaine sportive qui vient de s'écrouler ... 4 réunions webmeetings avec des clients chinois, eh bah, je peux vous dire que ça marque xD.
Et attendez, en bonus: la grosse réunion avec les 4 sites chinois en même temps, c'est tout simplement "WOW".
J'ai cru que je n'allais pas m'en sortir.
Sinon, j'ai continué mon projet SEO avec l'étude des mots clés de la longue traîne. Les mots-clés ne sont pas très variés: veille hse, veille hse réglementaire, veille réglementaire hse, iso 14001, veille environnementale, etc.
Pour trouver plus de mots clés, j'ai trouvé plusieurs techniques: google adwords, recherches associées, google wonderwheel, etc.
J'ai également créé un flux RSS pour le site vitrine de notre entreprise. J'estime que c'est un moyen pour dynamiser le site.
Faut juste se dire "Courage" !!

News du 17 mars 2012,
Hello !!
Oh la la, ça fait presque deux mois que je ne vous ai pas donné de nouvelles ! Et pour cause, j'étais complétement débordée !
Eh oui ! Bon que s'est-il passé en l'espace de deux mois ? Bah beaucoup de choses comme vous pouvez l'imaginer !
Je travaille toujours sur les alertes et bulletins pour la veille juridique HSE Chine, et je continue à peaufiner mon outil de veille.
Mes tâches en SEO avancent, mais très lentement. Je commence enfin seulement à toucher à leur Webmaster tools car je n'y avais pas accès avant.
Sinon, cela fait déjà 6 mois que je suis salariée ! Je vais sur mon 7eme mois en avril. Si je compte le stage, cela fera un an que je travaille déjà.
Le temps passe vraiment vite. Je me rappelle encore qu'au mois de Mars 2011, j'étais toute en stress à l'idée de la validation de mon Master. C'était une année riche en tout ce M2 ! I-N-O-U-B-L-I-A-B-L-E !!
Faut que je repasse là bas, juste pour les beaux souvenirs ;).

News du 21 janvier 2012,
Bonjour à tous !
Mes tests pour Autoveille par rapport à la réalisation du référentiel et de la collecte ont été faits ! Bilan ?
Je m'en suis plutôt bien sortie pour les deux tests !
En résumé, Autoveille est plus adapté pour le rapatriement automatique des textes dans le but de créer rapidement des référentiels réglementaires.
Pour automatiser la collecte (ou plutôt la veille), j'ai décidé de procéder par flux RSS qui, à mon avis, est une bonne solution pour veiller des sites qu'on ne regarde pas tout le temps.
J'ai également découvert un super outil qui permet de créer un flux RSS à partir d'une page web qui n'en a pas: page2rss.com !
Pour ce qui est de l'agrégateur, j'ai décidé d'utiliser Google Reader, qui me semble tout à apté à faire ce travail de veille et de collecte d'informations en temps réel.

News du 08 janvier 2012,
Bonjour à tous !
Voilà mon test "Référentiel" a été fait ! Pour résumer, cela s'est bien passé. J'ai pu aspirer automatiquement des sites web avec mon outil de veille. Autoveille a aspiré plus de 10 000 PDF, plus de 1500 DOC, et des millions de fichiers HTML en 2 jours ! Une chose qu'un humain n'aurait jamais pu faire à la main !
De plus, j'ai apporté des améliorations à mon logiciel d'automatisation de la veille: maintenant, on peut directement créer le corpus de textes de lois à partir de fichiers HTML avec la fonction html2text.
Il suffit de saisir la commande suivante: html2text *.html > nom_corpus.txt, et on obtient le corpus de textes.
Ensuite, il faut évidemment faire un nettoyage automatique du corpus.
Puis, après cette phase de nettoyage, on peut copier coller le corpus sur un Word pour qu'il soit traiter comme un référentiel tout prêt.
Le test "référentiel" me paraît ok. Maintenant, reste à voir si on réalise le référentiel jusqu'au bout.
La semaine prochaine, on attaque le test "collecte" ! GO ! Because, we can do it (hahaha, je n'ai pas oublié ma phrase préférée).