De meest geavanceerde zoekmogelijkheden voor juridische en onderzoeks doeleinden

ZyLAB’s voordelen | Zoek technieken | Fuzzy en wild-card | Legal search

ZyLAB's zoekmachine is geoptimaliseerd voor een maximale recall. Met andere woorden in plaats van het vinden van alleen de "beste" resultaten zal een zoekmachine die geoptimaliseerd is voor recall alles vinden dat relevant is. Zoeken op dit grondige nivo is vooral belangrijk voor intensieve onderoeken van hoog nivo..

ZyLAB's heeft reeds 25 jaar intensieve R&D gedaan op het vlak van zoektechnieken en dit heeft geleid tot een systeem dat het meeste haalt uit de data van de klanten. Andere producten zijn niet in staat om alle informatie te vinden of ze vragen de gebruiker kostbare data normalisatie na te streven, handmatig meta data toe te voegen, of andere manieren van het opschonen van data.

Vind meer met ZyLAB – zonder de ongemakken van teveel “noise”

  • ZyLAB kan full tekst zoeken in tekstuele data in meer dan 400 talen, in meer dan 700 verschillende electronische bestands formaten, e-mail, multimedia en gedigitalizeerd papier.
  • Naast het zoeken en extraheren van tekstuele content van documenten kan ZyLAB verborgen bestands-eigenschappen van documenten extraheren en doorzoeken. Dit geeft een overvloed van extra informatie waarop gezocht kan worden.
  • Met ZyLAB’s bekroonde , robuste en schaalbare fuzzy zoektechnieken Kunt u woorden vinden ondanks spelfouten, scan fouten, Optical Character Recognition (OCR) fouten, variaties in vertalingen wanneer een naam vertaald is uit een ander alfabet, spellings variatiesin farmaceutische of chamische namen, tikfouten, en negotiated Booleans in legal discoveries.
  • E-mail is een erg complex formaat met e-mails die zijn bijgesloten aan andere e-mails die dan weer meer e-mails, documenten, calendar items en taken bevatten. Wanneer u gebruik maakt van ZyLAB’s E-mail Archiving Module, kunt u elk component van een e-mail bericht doorzoeken, zelfs ge-embedde objecten. Dit kan door gebruik te maken van de Microsoft Exchange Connector en E-mail conversie (PST, NSF or GroupWise to XML) tools die bij de bundels horen.
  • Ook kunnen e-mail threads en meer dan 100 e-mail eigenschappen geextraheerd, doorzocht en gevisualiseerd worden.
  • ZyLAB kan een grote verscheidenheid aan bitmaps identificeren en ze in meer dan 400 talen OCR -en (zelfs met automatische taalherkenning ) zodaty ze eenvoudiger doorzoekbaar worden. Ongeacht of deze bitmaps op het bestands systeem of in een e-mail voorkomen kunnen ze doorzocht worden.
  • Zelfs wanneer een woord er niet binnen een document voorkomt of wanneer het verstopt is in de document- of bestandseigenschappen , kan ZyLAB’s Analytics Server de verborgen data extraheren of de tekst van een document door een concept extractor halen om zo semantische noties te vinden, een samenvatting to maken, entiteiten of complexe patronen te ontdekken, of onbekende connecties tussen personen, bedrijven, locaties en gebeurtenissen bloot te leggen. Al deze gextraheerde data kan dan gebruikt worden om er op te zoeken, de data te organizeren en documenten effectiever in te delen (lees ook Tekst Analyse section).
  • ZyLAB biedt tools om documenten handmatig te labellen en organizeren, zoals: een dynamische inhoudsopgave, dynamische search folders, hierarchische concepten, annotaties, anonimiseren, stempels, hyperlinks, categorizeren, database integraties, en het handmatig toekennen van meta data.
  • ZyLAB heeft verschillende producten om hett gedrag van de zoekmachine aan te passen, zoals: noise woorden, token identificatie, character mapping, code page en Unicode support, vertaalbare operators, interpunctie, en koppelteken - en apostrof- verwerking. Niet herkende en gecodeerde bestandsformaten kunnen automatisch ontdekt en verplaast worden naar een speciale locatie waar ze verder verwerkt worden. Tevens hebben alle aspecten van het index, extractie en zoek proces uitgebreide loging en audit functionaliteiten.

Het zoeken en beheren van informatie is erg belangrijk maar minstens even belangrijk is de mogelijkheid om de informatie te beheren nadat het gevonden is. Naast ZyLAB is er geen andere leverancier die zo'n uitgebreide set funtionaliteiten biedt om u te ondersteunen bij het beheren en onder controle houden van verschillende typen informatie, ongeacht het formaat.

Uitgebreid scala aan zoek mogelijkheden

ZyLAB heeft onder andere de volgende zoek techniekenom u te helpen bij het vinden waarnaar u zoekt: Boolean-, (directed) proximity-, phrase-, fuzzy-, wildcard-, concepten-, datum-, meta data-, bestands eigenschappen-, document eigenschappen-, entity-, progressief-, quorum-, transliteratie -, en numerieke reeks zoek mogelijkheden.

Additioneel zijn er verscheidene tools beschikbaar voorrangschikking op relevantie, ondersteuning bij het zoeken en voor de navigatie zoals hit dichtheid, sortering op meta data, hit highlighting, hit navigatie, vocabulair, zoek historie, synoniemen, taxonomy support, key word in context (KWIC) view-, verfijnen van zoekresultaten (gefaseerd zoeken), vinden van documenten sdie op elkaar lijken, geavanceerde visualisatie van een resultaten lijst (Treemap, Hyperbolic trees en integratie met Google maps), federatie (zowel federate en federated volgens de open search ATOM standaard), Internet Search engine integratie (Sitemap.org support), automatische alerting en opzoeken van documenten in een inhoudsopgave.

Extractie mogelijkheden zijn beschibaar voor entiteiten, feiten, gebeurtenissen, Bestands eigenschappen, document eigenschappen, meta data, HTML en XML tags, automatische taal herkenning, automatische samenvattingen, machine vertaling, document categorisering, etc. Voor meer information lees de Tekst Analyse sectie.

Fuzzy en wild-card zoekmogelijkheden

A fuzzy search kan alle voorkomens van een woord, samen met alle andere woorden die een er op lijkende spelling hebben localiseren. De fuzzy-graad geeft aan hoeveel karakters het mag verschillen van het originele woord en helpt bij het beheersen van het aantal resultaten. ZyLAB’s fuzzy search is geoptimaliseerd voor Optical Character Recognition (OCR) fouten, spellingsfouten en spelling variaties in namen die afgeleid zijn van niet-romeinse karakters zoals Cyrillisch, Arabisch, Farsi, Hindi, Hebreeuws, Chinees en Japans.

Een ander groot voordeel van ZyLAB’s fuzzy algoritme is dat de fuzzy zoekmogelijkheid taal en applicatie onafhankelijk is en niet “getraind” hoeft te worden zoals bij veel concurrenten wel het geval is. ZyLAB’s fuzzy search behoudt uitstekende precisie, zelfs bij een hoge fuzzy-graad, en het verschil in prestatie bij grote datasets tegenover kleine(re) datasets is te verwaarlozen. In tegenstelling tot veel andere producten mag bij ZyLAB’s fuzzy-search het eerste karakter verschillend zijn (als het eerste karakter van een woord van het zoekwoord verschilt, neemt ZyLAB’s fuzzy search ook dat woord mee).

Naast fuzzy search, kan ZyLAB ook zoeken met vele wildcards zonder dat dit aan snelheid inboet: ABC*, *ABC, A*C, en zelfs *ABC* behoren tot de mogelijkheden. Veel andere zoekmachines kunnen dit niet, met name de *ABC. Met name voor rechtshandhaving en onderzoek zijn deze zoektechnieken van groot belang, aangezien het vrijwel onmogelijk is om alle variaties van onjuist herkende, onjuist gespelde of pre-en post-fixes van aaneengeschakelde en verbogen woorden inzichtelijk te maken.

Legal search eist een ‘verdedigbaar’ zoekproces:

  • • Ondersteuning voor complexe Booleans, proximity en quorum zoeken
    • Snel fuzzy en geavanceerd wildcard zoeken (a*, *a, a*a, and *a*)
    • Treffer-markering en treffer-navigatie
    • Reproduceerbare en betrouwbare rangschikking naar relevantie
    • Forensisch indexeren van bestand- en documenteigenschappen
    • Automatische taalherkenning
    • Mogelijkheden tot het indexeren van samengestelde objecten zoals geneste
      e-mail, gecomprimeerde bestanden, e-mail collecties, Microsoft SharePoint,
      databases, en meer
    • Uitgebreide auditing en rapportagemogelijkheden voor het indexeren en het
      zoekproces
    • Indexering van alleen de veranderingen binnen gegevens op het netwerk
    • Integratie met records management, legal hold, het identificeren en
      verzamelen, legal review, (TIFF) productie en redigeer processen
    • Geavanceerde text analyse, automatische document categorisatie en
      automatische vertaling
    • Een bekende zoekmachine binnen de hedendaagse jurisprudentie