•Видове търсене
Можем да разделим функционалностите за търсене на Doxtream на три групи:
- Full-Text търсене, което се разделя на 2 подгрупи:
- Гъвкаво търсене
- Стриктно търсене
- Търсене на разпоредби
•Full-Text търсене
Нашето търсене по ключови думи и фрази също е изключително напреднало. Използваме специални алгоритми, като предварително анализираме и индексираме правните текстове. Може да разделим търсенето на 2 вида - гъвкаво и стриктно.
•Гъвкаво търсене
Гъвкавото търсене е търсенето по подразбиране. То ни позволява да откриваме релевантни резултати, дори когато търсената дума/фраза не отговаря напълно на заявката. За да постигнем това, използваме метода на Levenshtein distance, като измервaме броя на трансформациите на един символ (вмъквания, изтривания, замени и транспонирания), необходими за промяна на една дума в друга.
Например ако потребителят въведе "Хари Потър" с грешка като "Хари Потор", друга търсачка не би намерила съвпадения. Гъвкаво търсене обаче би разпознало, че това е търсената дума и би върнало релеванти резултати въпреки грешката. Тази гъвкавост е изключително полезна при обработката на нормативни и съдебни актове, защото често срещаме по различен начин смислово едни и същи неща и също така нещата, които търсим рядко са формулирани точно така, както си мислим, че ще са.
•Стриктно търсене
Този тип търсене ви позволява да търсите актове, в които съществува точно фразата, която сте въвели в определено поле. Тоест съвпаденията ще бъдат само фразите, където думите се появяват заедно и в същия ред.
•Търсене на разпоредби
Създадохме специални алгоритми, които ни позволяват да търсим сложни текстови модели в текста, използвайки реда и близостта на думите. По този начин успяваме да намерим най-релевантните резултати, когато търсим цитираните разпоредби в съдебните актове. Например ако потребителят въведе Чл. 92 от ЗГР
, резултатите от търсачката могат да бъдат: