Enterprise Search : Valorisez votre patrimoine documentaire ! - Partie 1

L’humanité a produit au cours des 30 dernières années plus d’informations qu’en 2000 ans d’histoire et ce volume double tous les 4 ans. Un cadre traite aujourd’hui 10 fois plus de données qu’il y a 15 ans.

L’entreprise n’échappe pas à la règle et les DSI sont les premiers impactés. Sur un plan IT, avec la multiplication des équipements de stockage et de sauvegarde de l’information. Mais également et surtout sur un plan IS avec de multiples réponses à apporter aux utilisateurs en termes de simplicité d’accès à l’information dans des silos qui ne cessent de se multiplier, notamment sous l’impulsion du cloud et son offre infinie d’applications SaaS[1].

Vous découvrirez dans cet article en quoi l’Enterprise Search est une approche permettant de répondre à ces problématiques par une approche centrée sur les contenus.

La maîtrise du patrimoine informationnel : un enjeu clé pour les organisations

Cette croissance du patrimoine informationnel s’est largement faite au profit de la donnée non structurée (dans les documents d’activité, opérationnels…). Le pourcentage d’informations gérées dans les bases de données traditionnelles (données structurées) continue de croître mais dans des proportions faibles alors que les volumes de données non structurées ont un taux de croissance exponentiel.

[1] SaaS : Le « Software as a Service » propose de consommer un logiciel sous la forme d’un service hébergé. Tarifées par abonnement, les solutions en mode SaaS couvrent les grands domaines fonctionnels : ERP, CRM, Analytics, logistique, applications métier… (définition JDN)

donnees non structurees

Le patrimoine informationnel ainsi généré doit permettre à l’entreprise de mieux appréhender :

  • Son environnement externe : ses clients, son marché, ses concurrents, ses actionnaires.
  • Son environnement interne : son personnel, son savoir-faire et sa capacité d’innovation, ses processus et méthodes.

La maîtrise des volumes d’informations ainsi générés s’impose comme une préoccupation majeure des organisations : l’explosion du volume et de la variété des données entraîne une accélération du phénomène de cloisonnement, empêchant toute vue globale.

Le moteur de recherche d’entreprise propose une approche stratégique de la gestion de l’information, pilotée par les usages et non par l’organisation ou les outils.

Cette approche transverse de l’information est particulièrement visible dans les utilisations les plus récentes des moteurs : les « Search Based Applications » (ou « applications orientées recherche »). Ce sont des espaces fédérés se présentant généralement sous forme de tableau de bord et proposant à l’utilisateur une vision 360° d’une thématique donnée, en agrégeant contenus pertinents, données provenant d’outils décisionnels et pratiques métiers/usages.

Un pilier de la Digital Workplace

Face à cette explosion du volume documentaire, les entreprises ont massivement investi dans des solutions d’ECM[1]. Ces outils, qui font partie intégrante de la Digital Workplace, optimisent le classement de l’information (hiérarchisation et classement, métadonnées…) mais n’améliorent pas pour autant la « trouvabilité » de celle-ci. L’utilisateur doit en permanence anticiper sa recherche d’information et savoir à l’avance où elle se trouve (dans quel répertoire, quel espace collaboratif, quelle plateforme…).

Mais qu’est-ce que la Digital Workplace ?

Joanna Pomian, consultante en transformation digitale du travail et en management des informations stratégiques chez SQLI, définit la Digital Workplace comme « l’environnement de travail du collaborateur intégrant tous ses outils de communication (téléphone, chat, vidéo), ses emails et ses outils habituels pour produire ses différents documents (ndlr. Office) et ensuite ses outils de collaboration et de partage social ». Elle se traduit généralement pour l’utilisateur par un portail lui permettant d’accéder à ses conversations et aux contacts associés, ses espaces documentaires et de collaboration, ses tâches et activités, ses

[1] ECM : « Enterprise Content Management » : Solution de gestion de contenu d’Entreprise. Les Solutions de GED (Gestion Electronique de Document), les plateformes collaboratives sont classifiées comme ECM

office 365

Cet accès centralisé, présuppose des possibilités innovantes de trouver la bonne information indépendamment de l’application/du silo dans laquelle elle se trouve pour mettre en perspective les résultats remontés à l’utilisateur : effectuer le croisement entre les conversations autour d’un document et le document lui-même, des domaines de compétences des auteurs et de leur proximité dans l’entreprise, des sujets « chauds » du moment par l’analyse des dernières publications de l’utilisateur mais aussi de ses collègues.

C’est dans cette optique que Microsoft propose Delve avec Office 365. Basé sur « Office Graph », le but affiché de Delve est de décloisonner l’informations pour la présenter à l’utilisateur en fonction des contenus sur lesquels il travaille, des personnes avec lesquelles il collabore régulièrement et des autorisations dont il dispose. En synthèse : tirer parti de l’intégralité des données de l’organisation.

microsoft delve

Catalyseur des nouveaux usages

La majorité des grands acteurs du digital ont comme point commun l’utilisation massive de la recherche comme composant maître de leurs applications. « Notre plateforme repose sur une combinaison de trois technologies : une base de données, un moteur de recherche et la connectivité. Une centaine de plateformes sont aussi construites sur cette combinaison comme LinkedIn, eBay, Dropbox, Uber ou Airbnb, et toutes ont vocation à devenir des world class products » explique Frédéric Mazzella, fondateur de Blablacar.

L’arsenal technologique en effet déployé par les solutions de recherche (taxonomie, linguistique, sémantique, logique floue) combinée à une solution de Big Data pour les analyses de données collectées permettent un ciblage chirurgical de la donnée et ainsi proposer à l’utilisateur l’information la plus pertinente.

Les publicités ciblées dans les applications Google ou Facebook, les articles et contacts suggérés dans LinkedIn sont tous poussés par une solution de recherche. Les données affichées sont, quant à elles, le fruit de requêtes complexes intégrant une multitude de paramètres : localisation géographique, compétences et recommandations de l’utilisateur, sphère sociale…

Un marché en mutation constante

Forrester Research sectorise le marché de la recherche en 3 catégories :

  • Les éditeurs de recherche spécialisés, regroupent les pure players de la recherche d’Entreprise (Attivio, Exalead…)
  • Les éditeurs de recherche intégrés, proposent la recherche comme « sous-système » de solutions de gestion de l’information et ne proposent généralement pas leur solution de recherche indépendamment.
  • Les éditeurs généralistes, dominée par Google avec sa Search Appliance. Les éditeurs appartenant à cette catégorie mettent l’accent sur la facilité de déploiement en proposant des offres de type « appliance» : L’intégration du moteur de recherche se résume ainsi à l’ajout d’un serveur préconfiguré dans son datacenter.

google search appliance

Depuis 2008, les grands éditeurs se sont positionnés sur le marché de l’Enterprise Search : Microsoft ouvre le bal avec l’acquisition de Fast, suivi de Dassault System qui rachète Exalead. C’est ensuite au tour d’HP et Oracle de racheter respectivement Autonomy et Endeca. Une partie de ces solutions de recherche ont été intégrées en tant que « brique » dans d’autres solutions des éditeurs : FAST ESP a été intégré à SharePoint et Endeca s’est mutée en solution de eDiscovery / data analytics.

De son côté, le marché de l’Open Source structure une offre libre autour de 2 solutions phares :

  • SolR : fusion des 2 projets Apache Group Lucene, une solution d’index de recherche et SolR, intégrant partiellement les fonctionnalités d’un Enterprise Search (connectivité, interface de recherche, interface d’administration).
  • Elastic (ex. Elastic Search) : basé aussi sur Lucene, ce moteur s’est spécialisé dans la très haute scalabilité et l’analyse en temps réel de grands volumes de données, notamment lorsqu’il est couplé à LogStash (collecte, analyse et stockage de log) et Kibana (data visualisation). Elastic possède en complément connectivité complète avec des solutions Big Data comme Hadoop.

Elastic et SolR ne sont pas pour autant des Enterprise Search. Leur particularité est de s’appuyer tous les 2 sur l’index Lucene qui sert de base à bon nombre de solutions de recherche d’Entreprise du marché (LucidWorks, PolySpot, SearchBlox…)

Début 2016, Google se recentre sur ses activités historiques (internet search et régie publicitaire) et annonce l’abandon de sa Search Appliance (GSA).

En parallèle, une nouvelle vague de moteurs a émergé. 3 solutions sont représentatives des orientations prises et usages adressés :

  • Attivio, identifié comme leader par Gartner, propose un moteur de Data Analytics en complément de son Enterprise Search
  • LucidWorks Fusion, se positionne comme le successeur légitime de la Google Search Appliance
  • Antidot, en plus de sa solution de recherche d’entreprise « Intelligente » (en s’appuyant sur des algorithmes d’intelligence artificielle et de machine learning), propose une solution de recherche spécialisée dans les problématiques eCommerce.

magic quadrant

Le Magic Quadrant de Gartner 2014 sur les solutions d’Enterprise Search. Gartner a fait le choix fort d’exclure toutes les solutions de recherche intégrées dans des suites logicielles : Microsoft et Oracle s’en trouvent donc exclus.

0 commentaires

votre commentaire

Se joindre à la discussion ?
Vous êtes libre de contribuer !

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Inscription newsletter

Ne manquez plus nos derniers articles !