A Keyword Retrieval Semantics over Relational Databases

Autor: Jannisthomas • May 17, 2018 • 2,038 Words (9 Pages) • 690 Views

Page 1 of 9

...

Algortima 1: Identifikasi dan dekomposisi algoritma

[pic 1]

Algoritma 1 analisis dan terurai kata kunci ke dalam substring karakter kata kunci, yang dicetak oleh gol yang relevan. Proses analitik sintaks puas dengan definisi 1, definisi hanya bertujuan sintaks ketiga dan menangani integritas yang relevan untuk operator "+". set pelengkap memiliki demarkasi jelas sementara atribut pengambilan adalah atribut numerik. Jika ada dua sintaks lainnya, adalah tidak perlu dan sulit untuk beroperasi. Selain itu, "+" operator merupakan perhitungan kombinasi kata kunci pencarian secara substansial, "-" operator adalah perhitungan eliminasi.

Hasil set menghilangkan tupel berlebihan untuk menyempurnakan hasil pencarian. Jika kata kunci pencarian berisi operator "+", ini mungkin naik redundansi, maka perlu ditangani oleh seluruh semantik, tapi "-" operator tidak perlu ditangani.

- Menyusun Pencarian

- Fokus Pencarian

Sebuah sistem pencarian menggunakan metode skor yang sama untuk setiap kata kunci. Setiap tuple dari setiap hubungan harus menetapkan nilai awal dengan "0" sebelum pengambilan untuk membentuk tabel skor dasar. Setiap tuple harus mendapatkan nilai skor yang lebih besar dari atau sama dengan 0 oleh gol, skor tidak membatasi maksimal. Model generasi pengambilan harus daftar hasil pencarian set sesuai dengan nilai-nilai skor dengan urutan.

[pic 2]

Definisi 2. Seachmark harus diberikan untuk kata kunci pencarian, jika Seachmark (Seachmark ?? R) adalah maksimum dari semua skor di tabel skor dasar, yaitu Seachmark = max (Seachmark 1, Seachmark 2, ...), Solr adalah fokus kata kunci pencarian, itu dilambangkan sebagai R = fokus (Q).

Untuk setiap Q (kw1, KW2, ...), hasilnya menetapkan baik adalah nol atau merupakan berdekatan memperluas fokus (Q), ini memperoleh hasil pengambilan kebutuhan pengguna dan menghindari redundansi. Scoring adalah kunci untuk mendapatkan fokus (Q).

- Pencarian Metadata

Mesin pengambilan mencari relasi tabel pencocokan (RMT) dan atribut yang cocok tabel (AMT) untuk memasok cocok pengambilan hubungan dan atribut untuk sintaks kedua dan yang ketiga, yang kata kunci sebelumnya cocok dengan hubungan atau atribut. Jika kata kunci cocok dengan salah satu dari hal-hal, cocok hubungan atau atribut yang relevan; jika kata kunci cocok dengan hubungan atau atribut sementara itu, hanya cocok hubungan mencetak dengan strategi mencetak gol yang relevan.

Dua kata kunci kelas yang mencetak gol setelah mereka cocok hubungan atau atribut. Sejak PENCARI tidak menganggap bahwa nama objek yang sama memiliki jenis objek yang berbeda antara pengguna. Kami memperbaiki struktur intrinsik untuk menambahkan dua baris untuk menyimpan nama pengguna dan jenis objek, nama pengguna toko baris pengguna, toko Jenis baris jenis objek, toko baris ObjectName semua nama relasi, Keyword toko baris kata kunci yang menggambarkan hubungan (atribut nama AT). Strukturnya adalah sebagai berikut:

[pic 3]

Dalam tabel pencocokan atribut, AT baris menyimpan semua atribut nama, toko baris Keyword atribut yang menjelaskan kata kunci, Jenis baris menyimpan jenis mereka. Demikian pula, kita memperbaiki struktur intrinsik untuk menambahkan baris pengguna untuk menyimpan nama pengguna. Pengguna mengirimkan kata kunci, dan pencetak gol analisis semantik pengambilan menurut dua tabel yang cocok, kalimat pengambilan harus disajikan.

[pic 4]

- Menyusun atribut numerik

Mencetak atribut numerik harus mendapatkan pengambilan lingkup sementara nilai mereka 0. Akibatnya, perlu untuk membatasi maksimum dan konsisten mencetak gol. Untuk semua tupel sehubungan dengan kondisi mencetak gol, skor mereka mungkin skor yang sama dengan berat yang sama sesuai dengan tupel yang relevan.

Rumus skor adalah sebagai berikut, di mana C adalah konstanta tertimbang menurut kebutuhan.

Algoritma 2: Menyusun algoritma untuk atribut numerik

[pic 5]

- Menyusun Atribut Teks

Beberapa sistem menggunakan strategi untuk membangun indeks teks lengkap untuk mencetak atribut teks. Sejak strategi yang rumit, kita menggunakan strategi mencetak gol tunggal, minimum adalah 0, dan maksimum adalah sebagai berikut:

[pic 6]

Formula penyusunan sebagai berikut:

[pic 7]

Dimana, DB adalah database dengan beberapa hubungan yang relevan; Q adalah serangkaian kata kunci; Ukuran (DB) adalah jumlah hubungan di DB database; J dan k tertimbang nilai sesuai dengan kebutuhan dalam proses penilaian.

Algoritma 3: Menyusun algoritma untuk atribut teks

[pic 8]

Algoritma 2 dan Algoritma 3 adalah untuk mengekstrak semua tupel sehubungan dengan kondisi mencetak gol dalam database sebagai hasil pengambilan. Sistem ini mencari fokus (Q) dengan melintasi database setelah mencetak gol. Jika fokus (Q) tidak null, sistem menghasilkan set yang terkait tuple (LTS), set hasil yang relevan (RS) harus kembali ke pengguna sesuai dengan LTS.

Algoritma 4: Menghasilkan algoritma untuk LTS

[pic 9]

Algoritma 4 dapat memperoleh LTS, itu ditransformasikan ke kalimat SQL relevan untuk mendapatkan hasil set, yang diurutkan untuk kembali pengguna dengan turun semacam menurut searchmark. operator dicapai dengan "order by fokus (Q). searchmark dan Ri.searchmark DESC ".

- Analisa Ekperimen

Pengaturan eksperimental adalah sebagai berikut: OS (Windows XP), CPU (AMD Athlon (tm) 64 X2 2.01GHz), MEMORY (1GB), RDBMS (SQL Server 2005); yang memutuskan database dan sistem pengambilan terhubung dengan ODBC-JDBC, sistem dicapai dengan Java, database eksperimental adalah subset dari DBLP. Skala eksperimental adalah produk Descartes domain relasional sekitar 2,5 * 1016.

Kami mempekerjakan presisi dan ingat untuk mengevaluasi efektivitas query, formulasi mereka adalah sebagai berikut:

[pic 10]

Dimana, | Ra

...

Download: txt (15.1 Kb) pdf (63.7 Kb) docx (122.2 Kb)

Continue for 8 more pages »

Read Full Essay Save to my library

Only available on Essays.club