ანალიტიკურ-ევრისტიკული კონცეპტები სემანიკური ძებნის ამოცანებში

ავტორი


მანანა ხაჩიძე, მაია არჩუაძე, გელა ბესიაშვილი

კატეგორია

ინტერნეტი, ელექტრონული მთავრობა, ელექტრონული კომერცია
სტატიის გადმოწერა

ანალიტიკურ-ევრისტიკული კონცეპტები სემანიკური ძებნის ამოცანებში
მანანა ხაჩიძე1, მაია არჩუაძე2, გელა ბესიაშვილი3
ი.ჯავახიშვლისის სახ. თბილისის სახელმწიფო უნივერსიტეტი
manana.khachidze@tsu.ge, maia.archuadze@tsu.ge, gela.besiashvili@tsu.ge

ანოტაცია – ნაშრომში განხილულია კონცეპტების ფორმირების მეთოდი, რომელიც საშუალებას იძლევა გამოვიყენოთ ისინი ინფორმაციის სემანტიკურ ძებნაში. მეთოდი შემუშავებულია ორი არსებული მეთოდის Explicit Semantic Analysis (ESA) და ანალიტიკური ევრისტიკების მეთოდების სინთეზის საფუძველზე. სტატიაში განხილულია შემოთავაზებული ცნების აღწერის (მისი ატრიბუტების) წარმოდგენისა და კონცეპტების გამოთვლის ახალი მეთოდი, რომელიც უფრო მოსახერხებელია და კომპაქტურად და სემანტიკურად ზუსტად აღწერს კონცეპტებს. ეს მეთოდი შეიძლება გამოყენებული იქნას კონცეპტუალური ძებნის სხვა მეთოდებთან ერთად.
საკვანძო სიტყვები – კონცეპტი, სემატიკური ძებნა, ანალიტიკურ-ევრისტიკული მეთოდი.
I. შესავალი
მიუხედავად იმისა, რომ ინფორმაციული ტექნოლოგიების სამომხმარებლო სივრცეში მუდმივად ჩნდებიან სხვადასხვა საძიებო სისტემები ინფორმაციის ძებნის ეფექტური ალგორითმების შექმნა კვლავ აქტუალურია. განსაკუთრებით აქტუალურია ინფორმაციის ნაკადის მზარდ მოცულობაში მომხმარებლის მოთხოვნის შესაბამისი (რელევანრური) ინფორმაციის მიღების შესაძლებლობა. აქ იკევეთება ორი ძირითადი მიმართულება: პასუხი მოთხოვნაზე იყოს რაც შეიძლება ზუსტი (სემანტიკური თვალსაზრისით) და 2. მოთხოვნაზე პასუხი იყოს რაც შეიძლება სწრაფი.
სემანტიკური თვალსაზრისით ზუსტი პასუხის მისაღებად აუცილებელია თვით მომხმარებლის მოთხოვნა წარმოსდგეს ისეთი ფორმალიზებული სახით, რომ არ დაირღვეს მისი შინაარსობრივი მნიშვნელობა. ჩვენ შევისწავლეთ მთელი რიგი მეთოდები, რომლებიც ნაწილობრიბ აგვარებენ ამ პრობლემას, მაგრამ უმრავლესი მათგანი დიდი მოცულობის ტექსტების სახით წარმოდგენილი ცოდნის სტატისტიკურ დამუშავებაზეა დაფუძნებული. არსებული სტატისტიკური ანალიზისაგან განსხვავდება Explicit Semantic Analysis (ESA) მეთოდი [1], რომელიც, ავტორების აზრით, სემანტიკურად ზუსტად წარმოადგენს განუზღვრელი მოცულობის ბუნებრივ ენოვან ტექსტებს. ეს მეთოდი ძირითადად ეფუძნება ცნენებათა ფორმირებას ვიკიპედიაში განთავსებული სხვადასხვა სტატიების ანალიზით. კვლევები რომლებიც ცნებათა ფორმირების მოდელირების სფეროში გასული საუკუნის 60-იანი წლებიდან მიმდინარეობს [2, 3], აქტუალობას არ კარგავს და ნებისმიერმა ახალმა ან მოდიფიცირებულმა მოდელმა შესაძლოა ახალი რეალობები წარმოაჩინოს კონცეპტების გამოყენების შესაძლებლობებში.
არანაკლებ საინტერესოა ცნებათა ფორმირების, სახეთა ამოცნობის და ობიექტთა კლასიფიკაციის ანალიტიკური ევრისტიკების მეთოდი [4]. ეს მეთოდი ასევე წარმატებით გამოიყენებოდა ცოდნის ბაზის ფორმირებისსათვის სხვადასხვა დანიშნულების ექსპერტული სისტემებისათვის [5,6].

სტატიის გადმოწერა——————————————————————–

Facebook Twitter Email Linkedin Google