Jose Nuez tarafından
Şimdiye kadar bu teknolojinin gerçek uygulamalarına en yakın arama motorları “İlişkilendirilebilir Dizin Oluşturma” olarak bilinir ve bu, Stemming altında veya eğimli olmayan köklerine (çoğullar, zarflar ve sıfat biçimleri) dayalı kelimelerin indekslenmesi altında yürürlüğe konulur. indekslemeden önce basit isim ve fiil formlarına indirgenir).
Gizli Anlamsal Analiz (LSA), 1990’da [1] Scott Deerwester, Susan Dumais, George Furnas, Thomas Landauer ve Richard Harshman tarafından icat edilen doğal dil işleme, özellikle vektörel anlambilimde bir tekniktir. Bilgi alma uygulaması bağlamında, bazen Gizli Anlamsal İndeksleme (LSI) olarak adlandırılır.
Gizli Anlamsal İndeksleme hakkında bazı hızlı gerçekler şunlardır:
1. LSI, popüler kelime eşleştirme yöntemlerinden% 30 daha etkilidir.
2. LSI, tam otomatik bir istatistiksel yöntem kullanır (Tekil Değer Ayrıştırma)
3. Diller arası erişimde çok etkilidir.
5. LSI, sorgu sözcükleri içermeyen ilgili bilgileri alabilir.
6. Diğer yöntemlerden daha uygun bilgiler bulur.
Gizli Anlamsal İndeksleme, belge indeksleme sürecine önemli bir adım ekler. Bir belgenin hangi anahtar sözcükleri içerdiğini kaydetmenin yanı sıra, yöntem, aynı sözcüklerden bazılarının diğerlerinin içerdiğini görmek için belge koleksiyonlarını bir bütün olarak inceler. LSI, birçok ortak kelimeye sahip belgelerin anlamsal olarak yakın ve ortak birkaç kelimesi olan belgelerin anlamsal olarak uzak olduğunu düşünür. Bu yöntem, bir insanın içeriğe nasıl baktığı, birden çok belgeyi nasıl sınıflandırdığı ile şaşırtıcı derecede iyi ilişkilidir.
GIPHY App Key not set. Please check settings