HARUN AYGÜN

14.7.15

DFA Metin Arama Algoritması Ters Parça Algoritması (Reverse Factor Algorithm)

Algoritma iki dizgiyi (string) karşılaştırmak için kullanılır. Basitçe bir dizgide aranan daha kısa dizginin öncelikle aşağıdaki şekilde karşılaştırılması ile başlanır. Ardından şayet uyum sağlanıyorsa bulundu olarak sonuç döndürülür, şayet uyum sağlanmıyorsa iki ihtimal vardır, dizgilerin karşılaştırılan kısımlarından uyan en uzun eke kadar kaydırma yapılır veya hiç uyuşma yoksa aranan dizgi kadar kaydırma yapılır.

Öncelikle bu kaydırma durumunu anlayalım. Uzun olan dizginin kısa olan dizgi kadarlık ilk kısmı aşağıdaki şekilde karşılaştırılacak.

Diyelim ki aradığımız uyum bulundu, o zaman bulduk diyerek sonucu döndürebiliriz.

Diyelim ki aradığımız uyum bulunamadı, o zaman acaba en azından bir kısmı uyuyor mu diye bakarak uyan kısmına kadar kaydırıyoruz.

Şayet hiç uymuyorsa, kısa olan dizgi kadar kaydırarak kalanını aramaya devam ediyoruz.

Algoritmanın mahareti, bu iki dizgiden bir kısmının uyup uymadığını nasıl bulduğunda saklı. Bunun için bir ek ağacı (suffix tree) oluşturuluyor ve bu ağaç kullanılarak hızlı bir şekilde iki dizginin ne kadarlık kısmının uyduğu tespit edilebilir. Biz de bir örnek üzerinde bu karşılaştırmayı yapalım. Bunun için öncelikle iki örnek dizgiyi aşağıdaki şekilde alalım:
Dizgi 1 : GCATCGGCGAGAGTATACAGTACG
Dizgi 2 : GCAGAGAG , boyutu 8 harf

Yapacağımız karşılaştırma öncesi, dizgi 2 için bir otomat oluşturuyoruz (sonlu durum otomatı (finite state machine). Otomat oluştururken aslında bizim Dizgi 1 içerisinde aramak istediğimiz dizgi 2 ihtimallerinin bir kümesini kabul eden otomat oluşturma hedefimiz var. Yani öncelikli olarak baktığımız dizgi2’nin tamamının (8 harfinin de ) içerilmesi, şayet bulamıyorsak, dizgi2’nin bir alt kümesi olan ve ilk 7 harfinin içerildiği bir durum bulmak (yani 1 kere yana kaydırılmış hali olarak düşünülebilir). Dolayısıyla otomatı oluşturacağımız alt küme L(S) ile gösterilecek olursa aşağıdaki şekildedir:

L(S) = { GCAGAGAG, GCAGAGA, GCAGAG, GCAGA, GCAG, GCA, GC, G, {} }

Kümenin sonunda ayrıca bir boş küme elemanı bulunmakta ve hiçbir harfin uymaması durumunu ifade etmektedir. Yukarıdaki kümedeki elemanları kabul eden sonlu durum otomatı (Finite state machine) aşağıdaki şekilde çizilebilir:

Dizgi de tekrar eden bazı alt dizgiler olduğu için yukarıdaki şekilde bir otomat oluşturuldu. Şimdi bu otomat kullanılarak bir ek ağacı (suffix tree) oluşturulabilir:

Yukarıdaki ek ağacı bizim dizgi karşılaştırmalarımızda kullanacağımız ve ne kadarlık son kısmın benzediğini bulmamıza yarayacak ağaç. Ağaç üzerinde her düğüme (node) birer numara verilmiş ve ayrıca ağacın yapraklarının altına da o yaprağa kadar izlenen yoldaki dizginin uzunluğu yazılmıştır.

Şimdi örnek olarak bir karşılaştırma durumunu ele alalım. Örneğin karşılaştırma işlemi aşağıdaki gibi dizgi1’in 6. Karakterinden itibaren dizgi 2’yi karşılaştırıyor olalım:

Yapacağımız işlem, pencereye dahil olan kısmı itibariyle (pencere boyutumuz dizgi 2’nin boyutu yani 8) en son karakter ile dizgi2’yi karşılaştırmak. Yani aslında karşılaştırılan ilk harfler aşağıdaki şekilde:

Ardından ek ağacındaki bir sonraki harfi yani aslında penceredeki sondan ikinci karakter ile dizgi2’nin ikinci karakterini aşağıdaki şekilde karşılaştırıyoruz ve bu işlem uyuşma olduğu sürece devam ediyor:

Sonuçta uyuşma olmayan noktaya erişildiğinde duruyoruz ve uyuşma olduğu kadar kaydırma işlemi yapıyoruz:

Aslında yukarıda dizgi üzerinde anlatılan bu işlem yapılırken ağaç üzerinde aşağıdaki şekilde bir yol izlenmiş ve 6 numaralı bitiş durumu ile otomat sonlandırılmıştır.

Algoritmanın ön işleme süresi, yani ek ağacını oluşturma süresi dizgi 2’nin boyutu ile orantılıdır ve bu boyut m ise karmaşıklığı O(m) olacaktır. Ardından arama süresindeki algoritma karmaşıklığı ise dizgi1’in boyutu ile orantılı olarak O(mn) olarak bulunacaktır.

Kaba Kuvvet Metin Arama Algoritması (Brute Force Text Search, Linear Text Search)

Bilgisayar Kullanılan en ilkel ziyaretinde dolayısıyla en Düşük ve orta gelirli ziyaretinde orta gelirli performanslı tıklayın aranması Bir Metnin İÇERİSİNDE Başka Bir Metnin bilimlerinde arama algoritmasıdır (arama algoritması). algoritma hedef Metinde, aranan Metni harf harf bulmaya Çalışır. Bu yapısından Dolayı diziler uzerinde Kullanılan Doğrusal arama (Doğrusal arama) algoritmasına oldukca Benzer ziyaretinde literatürde Doğrusal metin araması (Doğrusal metin arama) ismi de verilmektedir.

1 Algoritmanın başarısı,,

Kaba kuvvet algoritması, isminden de anlaşılacağı Üzere çok zeki olmayan başarısını bilgisayarın YÜKSEK hızda çalışmasından alan Bir algoritmadır Ettik. Algoritma basitçe metinin Tamamını çok zeki olmayan bır sekılde dolaşır ziyaretinde aranan kelimenin ilk harfini bulana Kadar bu isleme devam eder. Bulduğu anda geri kalan harfleri eşleştirmeye Çalışır. Şayet harflerden birisini eşleştiremezse, kelimenin ilk harfini bulduğu yere geri Dönerek arama işlemine devam eder. Gerçi çok zeki olmadigi kelimenin Tamamını eşleştirse safra yine de ilk harfi bulduğu yere geri Dönerek arama işlemine devam Eder tıklayın.

Bir örnek ziyaretinde çalışması 2 Algoritmanın

Kabe kuvvet metin arama algoritmasının (bruteforce metin arama algoritması) CALISMASINI aşağıdaki örnek Üzerinden anlamaya çalışalım.

Aranan kelimemiz: bilgi

Aranan metin: wwwbilgisayarkavramlaricom

Olarak veriliyor olsun. Bu DURUMDA algoritma ilk harften başlayarak "bilgi" kelimesini aranan metin İÇERİSİNDE bulmaya çalışacaktır.

  wwwbilgisayarkavramlaricom

  b ....

Öncelikle ilk harften başlanarak harfler karşılaştırılıyor. Aranan kelimenin ilk harfi "b" oldugu icin bu harf bulunana Kadar arama İşlemi devam ediyor:

  wwwbilgisayarkavramlaricom

   b ....

  wwwbilgisayarkavramlaricom

    b ....

  wwwbilgisayarkavramlaricom

     BİLGİ

"B" harfi ile Başlayan Bir Yer Bulundu. Artık Diğer harfler karşılaştırılabilir. Sırasıyla "Ben", "L" .. harfleri karşılaştırılıyor ziyaretinde harfler tuttuğu Sürece karşılastırma İşlemi devam ediyor. Şayet harflerden birisi beklenen Sırada gelmezse karşılastırma İşlemi kesilip kalınan yerden devam ediliyor.

  wwwBILGIsayarkavramlaricom

      b ....

Göster göster Aslında bu harflere bakılmış olmasina Rağmen yine de aranıyor. Malum kaba kuvvet arama algoritması akıllı Bir algoritma Değildir ziyaretinde bütün, ihtimalleri dener. Dolayısıyla Göster göster Aslında bakmış OLDUĞUMU ziyaretinde bakılmasının Bir anlamı olmayan bu harflere de bu algoritma Kapsamında bakılıyor.

  wwwBILGIsayarkavramlaricom

       b ....

Arama İşlemi aşağıdaki sekılde geri kalan harflerin KONTROLÜ ile devam ediyor:

  wwwBILGIsayarkavramlaricom

        b ....

  wwwBILGIsayarkavramlaricom

         b ....

  wwwBILGIsayarkavramlaricom

          b ....

  wwwBILGIsayarkavramlaricom

           b ....

  wwwBILGIsayarkavramlaricom

            b ....

  wwwBILGIsayarkavramlaricom

             b ....

  wwwBILGIsayarkavramlaricom

              b ....

  wwwBILGIsayarkavramlaricom

               b ....

  wwwBILGIsayarkavramlaricom

                b ....

  wwwBILGIsayarkavramlaricom

                 b ....

  wwwBILGIsayarkavramlaricom

                  b ....

  wwwBILGIsayarkavramlaricom

                   b ....

  wwwBILGIsayarkavramlaricom

                    b ....

  wwwBILGIsayarkavramlaricom

                     b ....

  wwwBILGIsayarkavramlaricom

                      b ....

  wwwBILGIsayarkavramlaricom

                       b ....

Yukarıdaki arama İşlemi sonucunda Büyük harfle gösterilen kısımda aranan kelime bulunmuştur. Toplam 26 harflik Bir metin İÇERİSİNDE 5 harflik "bilgi" aranmıştır kelimesi ziyaretinde 22 Adımda bulunmuştur.

Artin aranan kelimenin sığmayacağı oğlu harflere bakılmamıştır. Örneğin aranan Metnin oğlu 4 harfi olan "icom" alt Metni (alt dize) uzerinde arama İşlemi anlamsızdır Çukurhan buraya "bilgi" kelimesi sığamaz.

3 Algoritmanın kodlanması

Algoritmanın C, C ++, Java VEYA C # gibi diller tıklayın kodlaması aşağıdaki Iki iç içe döngü (iç içe döngü) şeklinde yapılabilir:

Yukarıdaki kodda, n boyutundaki y hedef anda yükleyiniz (string) İÇERİSİNDE m boyutunda x dizgisinin arandığı Kabil Edilmiştir. Döngü basitçe mil kere dönmektedir (yukarıdaki örnekte 22 kere dönemsi gibi) ziyaretinde şayet aranan kelimenin ilk harfi bulunursa, 8. Satırdaki iç döngü dönmeye BAŞLAR. Harfler tutuştukça dönme islemi devam ettirilir. Nihayetinde 11. Satırdaki koşul gerçekleşince, yani tutuşan harflerin sayısı, aranan kelimenin boyutunu geçince, yani aradığımız kelimedeki harf harf Kadar, birbirini tutunca SONUÇ gösterilir. Bu Işlem Metnin Sonuna Kadar tekrarlanır.

Boyer-Moore Arama algoritması

Bu algoritma Horspool algoritmasının geliştirilmiş halidir. Karşılaştırma yaptığımız pattern’in son karakterinin eşleştirilmesi başarısız olursa Horspool algoritmasındaki işlemin aynısı gerçekleştirilir. Fakat herhangi bir sayıda eşleşme olduktan sonra eşleşme başarısız olursa Horspool algoritmasından farklı davranır. Burada iki tablo ortaya çıkmaktadır. Horspool’dan gelen bad symbol shift ve farklı olarak gelen good-suffix shift. Boyer-Moore algoritması bu iki tabloyu değerlendirir ve bu tablolarda karşılık gelen değerlerden maksimum kaydırmayı sağlayacak olan durumu seçer. Bu seçim sayesinde Horspool algoritmasına göre daha büyük bir kayma sağlama şansı doğar.

Bu algoritmalar farklı karmaşıklıklara, çalışma zamanına ve alan kullanımına sahiptir. Bu nedenle bu algoritmalar belirli durumlarda diğerlerine göre daha etkin olabilmektedir.

String eşleştirme algoritmaları günümüzde birçok alanda kullanılmaktadır. Internet ve masaüstü uygulamaları, ofis uygulamaları, oyunlar vb. alanlarda kısaca tüm yazılım uygulamalarında string eşleştirme algoritmalarını kullanmaktayız. Bir programda Ctrl+F’e basarak ya da arama seçeneğine bir kelime girerek arama yaptığımızda bu algoritmalar kullanılmaktadır. Bu nedenle bu algoritmaların önemi bizim için büyüktür. Bu algoritmalar işlemlerimizi hızlandırır fakat bazı durumlarda bu işlem istediğimiz kadar hızlı gerçekleşmeyebilir. Bu nedenle farklı algoritmaların geliştirilmesiyle string eşleştirme işlemlerinin daha hızlı olması sağlanmaya çalışılmıştır.

Bu kısımda Boyer-Moore algoritmasını daha detaylı bir şekilde anlatacağız. Pattern’in en sağındaki karakterin text’teki ona karşılık konumdaki c karakteri ile eşleşmesi başarısız olursa, bu algoritma Horspool algoritması ile aynı şeyi yapmakdır. Önceden anlatıldığı şekilde tablodan elde edilen karakterlerin sahip oldukları değerler kadar pattern sağa kaydırılır.

İki algoritma k sayıda başarılı eşleştirmeden sonra(0 < k < m) eşleşmenin bozulması durumunda farklı davranırlar:

Bu durumda Boyer-Moore algoritması iki değişkene göre nasıl kaydırma yapacağına karar verir. İlki eşleşmenin bozulmasına neden olan text’teki c karakterinin karşısına denk gelen pattern’deki karakter ile belirlenir. Buna bad-symbol kaydırması denir. Bu kaydırmanın nedeni Horspool algoritmasındaki ile aynı nedendir. C karakteri pattern’de yoksa pattern’i c karakterini geçecek kadar sağa kaydırırız. Bu kaydırma t₁(c) – k formülü ile hesaplanır. Buradaki t₁(c) HHorspool algoritması kullanılarak hesaplanan tablodaki değerdir ve k da eşleştirilen karakter sayısıdır:

Örneğin bir text’te BARBER kelimesini ararsak ve text’teki S karakterinde eşleşme bozulana kadar son iki karakterde eşleşme sağlanacaktır. Pattern’i t₁(S) – 2 = 6 – 2 = 4 pozisyon kaydırabiliriz:

Aynı formül eşleşmenin bozulmasına neden olan karakterin pattern’de bulunması durumunda da kullanılır ( t₁(c) – k > 0). Örneğin bir text’te BARBER kelimesini ararsak ve A karakterinde eşleşme bozulana kadar ilk iki karakter eşleşmiştir. Bu durumda pattern’i t₁(A) – 2 = 4 – 2 = 2 pozisyon kaydırırız.

t₁(c) – k < 0 olması durumunda patterni 0 ya da negatif konumda kaydırmayacağımız kesindir. Bu durumda brüte-force taktiğindeki gibi pattern’i bir konum sapa kaydırabiliriz.

Özetlemek gerekirse Boyer-Moore algoritması ile hesaplanan d₁ bad-symbol kaydırma tablosundaki değer pozitifse t₁(c) – k, negatif veya sıfır ise de bu değer 1’dir. Bu aşağıdaki formül ile açıklanabilir.

d₁ = max{t₁(c) – k, 1}.

İkinci kaydırma türü pattern’deki son k > 0 başarılı eşleştirme ile belirlenmektedir. Pattern’deki k boyutundaki sonekleri suff(k) ile gösteriyoruz. Bu tip kaydırmaya da good-suffix kaydırma denmektedir. Bad-shift’te tek bir c karakterinin neden olduğu kaydırma burada 1 den m -1 e kadar olan soneklerin boyutlarının good-suffix kaydırma tablosunu doldurması ile gerçeklemektedir.

Öncelikle suff(k)’nın pattern’de başka bir konumda da olduğu durumu ele alalım. Bu durumda pattern’i d₂ boyutu kadar yani suff(k)’nın sağdan 2. kez yer aldığı konum arasındaki ile en sağda yer aldığı konum arasındaki fark kadar kaydırırız. Örneğin ABCBAB patterni için bu uzaklıklar k = 1 ve 2 için 2 ve 4 olacaktır:

Suff(k) değeri eğer pattern’de başka bir konumda yoksa ne yapılacak? Çoğu durumda pattern’i boyutu kadar kaydırabiliriz. Örneğin DBCBAB patterni ve k = 3 için, pattern’i boyutu olan 6 değeri kadar kaydırabiliriz.

Fakat bu durumda pattern’i boyutu kadar kaydırmak her zaman doğru adım olmayabilir. Örneğin ABCBAB ve K = 3 değeri için pattern’i 6 kaydırmak text’te AB ile başlayan substringlerin pattern’in son 2 karakteri ile eşleşmesi durumunun gözden kaçırılmasına neden olabilir:

6 kaydırma işlemi DBCBAB için doğru fakat ABCBAB için doğru değil, çünkü ikinci pattern aynı AB substring’ine prefix ve suffix olarak sahiptir. K boyutunda soneke dayanan kaydırmalarda böyle bir durumdan kaçınmak için l boyutundaki aynı sonek ile uyuşan l < k boyutundaki en uzun prefixi bulmalıyız. Eğer böyle bir prefix varsa, d₂ bu prefix ile sonek arasındaki farktan yola çıkarak hesaplanır. Örneğin aşağıda ABCBAB pattern’i için tam bir d₂değeri listesi bulunmaktadır.

Şimdi Boyer-Moore algoritmasını özetlemek gerekirse:

The Boyer-Moore algorithm

Adım 1 Verilen pattern ve text için bad-symbol kaydırma tablosunu oluştur.
Adım 2 Pattern’i kullanarak good-suffix kaydırma tablosunu oluştur.
Adım 3 Pattern’i text’in başlangıcı ile hizala.

Adım 4 Aşağıdaki işlemleri pattern’i text’te bulana kadar ya da text’in sonuna ulaşana kadar yap. Patterndeki son karakterden başlayarak texteki ve patterndeki denk gelen karakterleri m sayıda eşleştirme sağlanana kadar ya da k >= 0 sayıda eşleşme sağladıktan sonra eşleşmeyi bozan bir duruma denk gelene kadar karşılaştır. İkinci durumda bad-symbol tablosundaki c kolonundan t₁(c) girdisini al. Burada c eşleşmeyi bozan karakterdir. k > 0 ise good-suffix tablosunda karşılık gelen d₂ girdisini al. Pattern’i aşağıdaki formülden elde edilen şekilde kaydır:

k > 0 iken iki olası kaydırmadan maksimum olanı almak mantıklıdır. Bu iki kaydırma gözlemlere dayanmaktadır. Birincisi eşleşmeyi bozan karakter diğeri de pattern’in en sağdaki karakterlerinin eşleşen grubu hakkındadır. Bu da demektir ki pattern’i d₁ ve d₂ den daha az kaydırırsak herhangi bir eşleşme sağlayamayacağımız bir duruma gelmiş olacağımız kesindir. Amacımız pattern’i kayıpsız bir şekilde en büyük boyutta kaydırmak olduğu için bu iki sayıdan büyük olanı alırız.

ÖRNEK BAOBAB pattern’inin İngilizce karakterlerden ve space’den oluşan bir text’te arayalım. Bad-symbol kaydırma tablosu aşağıdaki gibidir:

Good-suffix tablosu da şu şekildedir:

Patterndeki B karakterinin textteki K karakteri ile karşılaştırmasısı olumsuz olacağı için algoritma t₁(K) = 6 yı bad-symbol tablosundan alır ve pattern’i d₁ = max{t₁(K) – 0, 1} = 6 kadar sağa kaydırır. Yeni deneme iki karakteri başarılı bir şekilde eşleştirir. 3. Karakterdeki başarısızlıktan sonra algoritma t₁(_) = 6 değerini bad-symbol tablosundan ve d₂ = 5 değerini de good-suffix tablosundan alır. Pattern’i bu iki değerden maksimum olanı kadar sağa kaydırır. Max{d₁, d₂} = max { 6 – 2, 5} = 5. Bu durumda good-suffix tablosu daha ileri bir noktaya kaydırma yapmamızı sağlamıştır.

Sıradaki deneme B karakterini eşleştirir. Fakat boşluk karakteri nedeniyle eşleşme bozulur. Algoritma t1(_) = 6 değerini bad-shift tablosundan ve d₂ = 2 değerini de good-suffix tablosundan alır. Pattern max{d₁, d₂} = max { 6 – 1, 2} = 5 kadar sağa kaydırılır. Bu durumda bad-shift tablosu daha ileri gitmemizi sağlamıştır. Son deneme de pattern’i text’te 6 tane başarılı karşılaştırmadan sonra bulur.

Pattern’in ilk bulunduğu noktayı tespit etmek için Boyer-Moore algorimasının worst-case etkinliği lineerdir. Bu algoritma özellikle geniş alfabelerde oldukça hızlıdır. Birçok insan doğal dil benzeri stringlerde bu algoritmanın daha basit sürümerini tercih eder. Ör: Horspool.

/// <summary>

/// Bad-shift tablosunu oluşturur

/// </summary>

/// <param name="pattern">Text'te aranacak kelime</param>

/// <returns>BadShift tablosunu döndürür</returns>

private static int[] BuildBadCharacterShift(string pattern)

{

int[] badCharacterShift = new int[352];

for (int c = 0; c < badCharacterShift.Length; ++c) //Her karaktere pattern lenght'ini ata

badCharacterShift[c] = pattern.Length;

for (int i = 0; i < pattern.Length - 1; ++i) //Patternde olan karakterlere sondan başlayarak karşılaşılan ilk konuma göre shift değerini ata

badCharacterShift[pattern[i]] = pattern.Length - i - 1;

badShift = badCharacterShift;

return badCharacterShift; //BadShift tablosunu döndür

}

Burada Horspool algoritmasındaki kaydırma tablosuna benzer şekilde bad-shift tablosu oluşturuluyor.

private static int[] FindSuffixes(string pattern)

{

int f = 0, g;

int patternLength = pattern.Length;

int[] suffixes = new int[pattern.Length + 1]; //Sonek dizisi initialize ediliyor

suffixes[patternLength - 1] = patternLength; //Son elemana patterin boyutu atanıyor

g = patternLength - 1;

for (int i = patternLength - 2; i >= 0; --i) //Pattern boyutu - 1 kadar dönülüyor

{

if (i > g && suffixes[i + patternLength - 1 - f] < i - g) //Karakter patternde tekrar ediyor mu

suffixes[i] = suffixes[i + patternLength - 1 - f];

else

{

if (i < g)

g = i;

f = i;

while (g >= 0 && (pattern[g] == pattern[g + patternLength - 1 - f])) //Karakter kendinden önceki karakterle eşitse

--g;

suffixes[i] = f - g; //Farkı tabloya ata

}

return suffixes; //Sonek tablosunu döndürüyor

}

Bu algoritma sayesinde good-suffix tablosunun oluşturulmasında kullanılacak sonekleri belirliyoruz.

/// <summary>

/// Good-shift tablosunu oluşturur

/// </summary>

/// <param name="pattern">Text'te aranacak kelime</param>

/// <param name="suff">Sonek tablosu</param>

/// <returns>GoodShift tablosunu döndürür</returns>

private static int[] BuildGoodSuffixShift(string pattern, int[] suff)

{

int patternLength = pattern.Length;

int[] goodSuffixShift = new int[pattern.Length + 1];

for (int i = 0; i < patternLength; ++i) //Tüm elemanlara pattern boyutunu ata

goodSuffixShift[i] = patternLength;

int j = 0;

for (int i = patternLength - 1; i >= -1; --i)

if (i == -1 || suff[i] == i + 1) //Karakter dizisi tekrar ediyor mu?

for (; j < patternLength - 1 - i; ++j)

if (goodSuffixShift[j] == patternLength) //Daha düşük sonuç varsa ata

goodSuffixShift[j] = patternLength - 1 - i;

for (int i = 0; i <= patternLength - 2; ++i) //Tabloyu doldur

goodSuffixShift[patternLength - 1 - suff[i]] = patternLength - 1 - i;

goodShift = goodSuffixShift;

return goodSuffixShift; //GoodShift tablosunu döndür

}

Good-suffix algoritması değişken olarak pattern ve suff[]’ı alıyor. Bu değerleri kullanarak good-suffix tablosu belirleniyor.

private static int BoyerMooreMatching(string pattern, string text)

{

int[] m_badCharacterShift = BuildBadCharacterShift(pattern); //Bad-shift tablosunu oluşturan methodu çağır

int[] m_suffixes = FindSuffixes(pattern);

int[] m_goodSuffixShift = BuildGoodSuffixShift(pattern, m_suffixes); //Good-shift tablosunu oluşturan methodu çağır

int index = 0;

while (index <= textLength - patternLength) //Text'in karşılaştırılacak son noktasına gelinmediyse

{

int unmatched;

for (unmatched = patternLength - 1; //Key comparison

unmatched >= 0 && (pattern[unmatched] == text[unmatched + index]);

--unmatched

)

if (unmatched < 0) //Pattern bulunduysa

{

return index; //Eşleşme konumunu döndür

}

else //Eşleşme sağlanamadıysa good ve bad shift tablolarındaki max değere göre indexi kaydır

index += Math.Max(m_goodSuffixShift[unmatched],

m_badCharacterShift[text[unmatched + index]] - patternLength + 1 + unmatched);

}

return -1; //Eşleşme yoksa

}

14.7.15

DFA Metin Arama Algoritması Ters Parça Algoritması (Reverse Factor Algorithm)

Kaba Kuvvet Metin Arama Algoritması (Brute Force Text Search, Linear Text Search)

Boyer-Moore Arama algoritması

Toplam Sayfa Görüntüleme Sayısı