<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>Indexer ses documents bureautique avec la suite Elastic et FSCrawler</title>
        <link>https://videos.capitoledulibre.org/videos/watch/7bf61807-7fba-47e5-acb6-cdbb697b534b</link>
        <description>David Pilato Vous avez sous la main des tonnes de documents Open Office, Microsoft Office, PDF voire des images... et vous aimeriez être capable de chercher dans leurs meta-données et dans le contenu lui-même. Comment faire ? Surtout depuis l'annonce de la fin de Google Search Appliance. Dans cette session, David expliquera comment Apache Tika peut fournir ce service et comment combiner cette fantastique librairie avec elasticsearch : Elasticsearch ingest-attachment plugin (https://www.elastic.co/guide/en/elasticsearch/plugins/current/ingest-attachment.html) FSCrawler (https://github.com/dadoonet/fscrawler) Connecteur Workplace Search (https://www.elastic.co/fr/enterprise-search/workplace-search) pour FSCrawler afin de disposer sur étagère d'une interface utilisateur puissante pour vos documents. Captation par @TVn7Toulouse</description>
        <lastBuildDate>Sat, 11 Apr 2026 11:28:44 GMT</lastBuildDate>
        <docs>https://validator.w3.org/feed/docs/rss2.html</docs>
        <generator>PeerTube - https://videos.capitoledulibre.org</generator>
        <image>
            <title>Indexer ses documents bureautique avec la suite Elastic et FSCrawler</title>
            <url>https://videos.capitoledulibre.org/lazy-static/avatars/61548430-e201-4f4b-ac5a-f903422c6ea2.png</url>
            <link>https://videos.capitoledulibre.org/videos/watch/7bf61807-7fba-47e5-acb6-cdbb697b534b</link>
        </image>
        <copyright>All rights reserved, unless otherwise specified in the terms specified at https://videos.capitoledulibre.org/about and potential licenses granted by each content's rightholder.</copyright>
        <atom:link href="https://videos.capitoledulibre.org/feeds/video-comments.xml?videoId=7bf61807-7fba-47e5-acb6-cdbb697b534b" rel="self" type="application/rss+xml"/>
    </channel>
</rss>