HARUN AYGÜN

14.7.15

Kaba Kuvvet Metin Arama Algoritması (Brute Force Text Search, Linear Text Search)

Bilgisayar Kullanılan en ilkel ziyaretinde dolayısıyla en Düşük ve orta gelirli ziyaretinde orta gelirli performanslı tıklayın aranması Bir Metnin İÇERİSİNDE Başka Bir Metnin bilimlerinde arama algoritmasıdır (arama algoritması). algoritma hedef Metinde, aranan Metni harf harf bulmaya Çalışır. Bu yapısından Dolayı diziler uzerinde Kullanılan Doğrusal arama (Doğrusal arama) algoritmasına oldukca Benzer ziyaretinde literatürde Doğrusal metin araması (Doğrusal metin arama) ismi de verilmektedir.

1 Algoritmanın başarısı,,

Kaba kuvvet algoritması, isminden de anlaşılacağı Üzere çok zeki olmayan başarısını bilgisayarın YÜKSEK hızda çalışmasından alan Bir algoritmadır Ettik. Algoritma basitçe metinin Tamamını çok zeki olmayan bır sekılde dolaşır ziyaretinde aranan kelimenin ilk harfini bulana Kadar bu isleme devam eder. Bulduğu anda geri kalan harfleri eşleştirmeye Çalışır. Şayet harflerden birisini eşleştiremezse, kelimenin ilk harfini bulduğu yere geri Dönerek arama işlemine devam eder. Gerçi çok zeki olmadigi kelimenin Tamamını eşleştirse safra yine de ilk harfi bulduğu yere geri Dönerek arama işlemine devam Eder tıklayın.

Bir örnek ziyaretinde çalışması 2 Algoritmanın

Kabe kuvvet metin arama algoritmasının (bruteforce metin arama algoritması) CALISMASINI aşağıdaki örnek Üzerinden anlamaya çalışalım.

Aranan kelimemiz: bilgi

Aranan metin: wwwbilgisayarkavramlaricom

Olarak veriliyor olsun. Bu DURUMDA algoritma ilk harften başlayarak "bilgi" kelimesini aranan metin İÇERİSİNDE bulmaya çalışacaktır.

  wwwbilgisayarkavramlaricom

  b ....

Öncelikle ilk harften başlanarak harfler karşılaştırılıyor. Aranan kelimenin ilk harfi "b" oldugu icin bu harf bulunana Kadar arama İşlemi devam ediyor:

  wwwbilgisayarkavramlaricom

   b ....

  wwwbilgisayarkavramlaricom

    b ....

  wwwbilgisayarkavramlaricom

     BİLGİ

"B" harfi ile Başlayan Bir Yer Bulundu. Artık Diğer harfler karşılaştırılabilir. Sırasıyla "Ben", "L" .. harfleri karşılaştırılıyor ziyaretinde harfler tuttuğu Sürece karşılastırma İşlemi devam ediyor. Şayet harflerden birisi beklenen Sırada gelmezse karşılastırma İşlemi kesilip kalınan yerden devam ediliyor.

  wwwBILGIsayarkavramlaricom

      b ....

Göster göster Aslında bu harflere bakılmış olmasina Rağmen yine de aranıyor. Malum kaba kuvvet arama algoritması akıllı Bir algoritma Değildir ziyaretinde bütün, ihtimalleri dener. Dolayısıyla Göster göster Aslında bakmış OLDUĞUMU ziyaretinde bakılmasının Bir anlamı olmayan bu harflere de bu algoritma Kapsamında bakılıyor.

  wwwBILGIsayarkavramlaricom

       b ....

Arama İşlemi aşağıdaki sekılde geri kalan harflerin KONTROLÜ ile devam ediyor:

  wwwBILGIsayarkavramlaricom

        b ....

  wwwBILGIsayarkavramlaricom

         b ....

  wwwBILGIsayarkavramlaricom

          b ....

  wwwBILGIsayarkavramlaricom

           b ....

  wwwBILGIsayarkavramlaricom

            b ....

  wwwBILGIsayarkavramlaricom

             b ....

  wwwBILGIsayarkavramlaricom

              b ....

  wwwBILGIsayarkavramlaricom

               b ....

  wwwBILGIsayarkavramlaricom

                b ....

  wwwBILGIsayarkavramlaricom

                 b ....

  wwwBILGIsayarkavramlaricom

                  b ....

  wwwBILGIsayarkavramlaricom

                   b ....

  wwwBILGIsayarkavramlaricom

                    b ....

  wwwBILGIsayarkavramlaricom

                     b ....

  wwwBILGIsayarkavramlaricom

                      b ....

  wwwBILGIsayarkavramlaricom

                       b ....

Yukarıdaki arama İşlemi sonucunda Büyük harfle gösterilen kısımda aranan kelime bulunmuştur. Toplam 26 harflik Bir metin İÇERİSİNDE 5 harflik "bilgi" aranmıştır kelimesi ziyaretinde 22 Adımda bulunmuştur.

Artin aranan kelimenin sığmayacağı oğlu harflere bakılmamıştır. Örneğin aranan Metnin oğlu 4 harfi olan "icom" alt Metni (alt dize) uzerinde arama İşlemi anlamsızdır Çukurhan buraya "bilgi" kelimesi sığamaz.

3 Algoritmanın kodlanması

Algoritmanın C, C ++, Java VEYA C # gibi diller tıklayın kodlaması aşağıdaki Iki iç içe döngü (iç içe döngü) şeklinde yapılabilir:

Yukarıdaki kodda, n boyutundaki y hedef anda yükleyiniz (string) İÇERİSİNDE m boyutunda x dizgisinin arandığı Kabil Edilmiştir. Döngü basitçe mil kere dönmektedir (yukarıdaki örnekte 22 kere dönemsi gibi) ziyaretinde şayet aranan kelimenin ilk harfi bulunursa, 8. Satırdaki iç döngü dönmeye BAŞLAR. Harfler tutuştukça dönme islemi devam ettirilir. Nihayetinde 11. Satırdaki koşul gerçekleşince, yani tutuşan harflerin sayısı, aranan kelimenin boyutunu geçince, yani aradığımız kelimedeki harf harf Kadar, birbirini tutunca SONUÇ gösterilir. Bu Işlem Metnin Sonuna Kadar tekrarlanır.

Boyer-Moore Arama algoritması

Bu algoritma Horspool algoritmasının geliştirilmiş halidir. Karşılaştırma yaptığımız pattern’in son karakterinin eşleştirilmesi başarısız olursa Horspool algoritmasındaki işlemin aynısı gerçekleştirilir. Fakat herhangi bir sayıda eşleşme olduktan sonra eşleşme başarısız olursa Horspool algoritmasından farklı davranır. Burada iki tablo ortaya çıkmaktadır. Horspool’dan gelen bad symbol shift ve farklı olarak gelen good-suffix shift. Boyer-Moore algoritması bu iki tabloyu değerlendirir ve bu tablolarda karşılık gelen değerlerden maksimum kaydırmayı sağlayacak olan durumu seçer. Bu seçim sayesinde Horspool algoritmasına göre daha büyük bir kayma sağlama şansı doğar.

Bu algoritmalar farklı karmaşıklıklara, çalışma zamanına ve alan kullanımına sahiptir. Bu nedenle bu algoritmalar belirli durumlarda diğerlerine göre daha etkin olabilmektedir.

String eşleştirme algoritmaları günümüzde birçok alanda kullanılmaktadır. Internet ve masaüstü uygulamaları, ofis uygulamaları, oyunlar vb. alanlarda kısaca tüm yazılım uygulamalarında string eşleştirme algoritmalarını kullanmaktayız. Bir programda Ctrl+F’e basarak ya da arama seçeneğine bir kelime girerek arama yaptığımızda bu algoritmalar kullanılmaktadır. Bu nedenle bu algoritmaların önemi bizim için büyüktür. Bu algoritmalar işlemlerimizi hızlandırır fakat bazı durumlarda bu işlem istediğimiz kadar hızlı gerçekleşmeyebilir. Bu nedenle farklı algoritmaların geliştirilmesiyle string eşleştirme işlemlerinin daha hızlı olması sağlanmaya çalışılmıştır.

Bu kısımda Boyer-Moore algoritmasını daha detaylı bir şekilde anlatacağız. Pattern’in en sağındaki karakterin text’teki ona karşılık konumdaki c karakteri ile eşleşmesi başarısız olursa, bu algoritma Horspool algoritması ile aynı şeyi yapmakdır. Önceden anlatıldığı şekilde tablodan elde edilen karakterlerin sahip oldukları değerler kadar pattern sağa kaydırılır.

İki algoritma k sayıda başarılı eşleştirmeden sonra(0 < k < m) eşleşmenin bozulması durumunda farklı davranırlar:

Bu durumda Boyer-Moore algoritması iki değişkene göre nasıl kaydırma yapacağına karar verir. İlki eşleşmenin bozulmasına neden olan text’teki c karakterinin karşısına denk gelen pattern’deki karakter ile belirlenir. Buna bad-symbol kaydırması denir. Bu kaydırmanın nedeni Horspool algoritmasındaki ile aynı nedendir. C karakteri pattern’de yoksa pattern’i c karakterini geçecek kadar sağa kaydırırız. Bu kaydırma t₁(c) – k formülü ile hesaplanır. Buradaki t₁(c) HHorspool algoritması kullanılarak hesaplanan tablodaki değerdir ve k da eşleştirilen karakter sayısıdır:

Örneğin bir text’te BARBER kelimesini ararsak ve text’teki S karakterinde eşleşme bozulana kadar son iki karakterde eşleşme sağlanacaktır. Pattern’i t₁(S) – 2 = 6 – 2 = 4 pozisyon kaydırabiliriz:

Aynı formül eşleşmenin bozulmasına neden olan karakterin pattern’de bulunması durumunda da kullanılır ( t₁(c) – k > 0). Örneğin bir text’te BARBER kelimesini ararsak ve A karakterinde eşleşme bozulana kadar ilk iki karakter eşleşmiştir. Bu durumda pattern’i t₁(A) – 2 = 4 – 2 = 2 pozisyon kaydırırız.

t₁(c) – k < 0 olması durumunda patterni 0 ya da negatif konumda kaydırmayacağımız kesindir. Bu durumda brüte-force taktiğindeki gibi pattern’i bir konum sapa kaydırabiliriz.

Özetlemek gerekirse Boyer-Moore algoritması ile hesaplanan d₁ bad-symbol kaydırma tablosundaki değer pozitifse t₁(c) – k, negatif veya sıfır ise de bu değer 1’dir. Bu aşağıdaki formül ile açıklanabilir.

d₁ = max{t₁(c) – k, 1}.

İkinci kaydırma türü pattern’deki son k > 0 başarılı eşleştirme ile belirlenmektedir. Pattern’deki k boyutundaki sonekleri suff(k) ile gösteriyoruz. Bu tip kaydırmaya da good-suffix kaydırma denmektedir. Bad-shift’te tek bir c karakterinin neden olduğu kaydırma burada 1 den m -1 e kadar olan soneklerin boyutlarının good-suffix kaydırma tablosunu doldurması ile gerçeklemektedir.

Öncelikle suff(k)’nın pattern’de başka bir konumda da olduğu durumu ele alalım. Bu durumda pattern’i d₂ boyutu kadar yani suff(k)’nın sağdan 2. kez yer aldığı konum arasındaki ile en sağda yer aldığı konum arasındaki fark kadar kaydırırız. Örneğin ABCBAB patterni için bu uzaklıklar k = 1 ve 2 için 2 ve 4 olacaktır:

Suff(k) değeri eğer pattern’de başka bir konumda yoksa ne yapılacak? Çoğu durumda pattern’i boyutu kadar kaydırabiliriz. Örneğin DBCBAB patterni ve k = 3 için, pattern’i boyutu olan 6 değeri kadar kaydırabiliriz.

Fakat bu durumda pattern’i boyutu kadar kaydırmak her zaman doğru adım olmayabilir. Örneğin ABCBAB ve K = 3 değeri için pattern’i 6 kaydırmak text’te AB ile başlayan substringlerin pattern’in son 2 karakteri ile eşleşmesi durumunun gözden kaçırılmasına neden olabilir:

6 kaydırma işlemi DBCBAB için doğru fakat ABCBAB için doğru değil, çünkü ikinci pattern aynı AB substring’ine prefix ve suffix olarak sahiptir. K boyutunda soneke dayanan kaydırmalarda böyle bir durumdan kaçınmak için l boyutundaki aynı sonek ile uyuşan l < k boyutundaki en uzun prefixi bulmalıyız. Eğer böyle bir prefix varsa, d₂ bu prefix ile sonek arasındaki farktan yola çıkarak hesaplanır. Örneğin aşağıda ABCBAB pattern’i için tam bir d₂değeri listesi bulunmaktadır.

Şimdi Boyer-Moore algoritmasını özetlemek gerekirse:

The Boyer-Moore algorithm

Adım 1 Verilen pattern ve text için bad-symbol kaydırma tablosunu oluştur.
Adım 2 Pattern’i kullanarak good-suffix kaydırma tablosunu oluştur.
Adım 3 Pattern’i text’in başlangıcı ile hizala.

Adım 4 Aşağıdaki işlemleri pattern’i text’te bulana kadar ya da text’in sonuna ulaşana kadar yap. Patterndeki son karakterden başlayarak texteki ve patterndeki denk gelen karakterleri m sayıda eşleştirme sağlanana kadar ya da k >= 0 sayıda eşleşme sağladıktan sonra eşleşmeyi bozan bir duruma denk gelene kadar karşılaştır. İkinci durumda bad-symbol tablosundaki c kolonundan t₁(c) girdisini al. Burada c eşleşmeyi bozan karakterdir. k > 0 ise good-suffix tablosunda karşılık gelen d₂ girdisini al. Pattern’i aşağıdaki formülden elde edilen şekilde kaydır:

k > 0 iken iki olası kaydırmadan maksimum olanı almak mantıklıdır. Bu iki kaydırma gözlemlere dayanmaktadır. Birincisi eşleşmeyi bozan karakter diğeri de pattern’in en sağdaki karakterlerinin eşleşen grubu hakkındadır. Bu da demektir ki pattern’i d₁ ve d₂ den daha az kaydırırsak herhangi bir eşleşme sağlayamayacağımız bir duruma gelmiş olacağımız kesindir. Amacımız pattern’i kayıpsız bir şekilde en büyük boyutta kaydırmak olduğu için bu iki sayıdan büyük olanı alırız.

ÖRNEK BAOBAB pattern’inin İngilizce karakterlerden ve space’den oluşan bir text’te arayalım. Bad-symbol kaydırma tablosu aşağıdaki gibidir:

Good-suffix tablosu da şu şekildedir:

Patterndeki B karakterinin textteki K karakteri ile karşılaştırmasısı olumsuz olacağı için algoritma t₁(K) = 6 yı bad-symbol tablosundan alır ve pattern’i d₁ = max{t₁(K) – 0, 1} = 6 kadar sağa kaydırır. Yeni deneme iki karakteri başarılı bir şekilde eşleştirir. 3. Karakterdeki başarısızlıktan sonra algoritma t₁(_) = 6 değerini bad-symbol tablosundan ve d₂ = 5 değerini de good-suffix tablosundan alır. Pattern’i bu iki değerden maksimum olanı kadar sağa kaydırır. Max{d₁, d₂} = max { 6 – 2, 5} = 5. Bu durumda good-suffix tablosu daha ileri bir noktaya kaydırma yapmamızı sağlamıştır.

Sıradaki deneme B karakterini eşleştirir. Fakat boşluk karakteri nedeniyle eşleşme bozulur. Algoritma t1(_) = 6 değerini bad-shift tablosundan ve d₂ = 2 değerini de good-suffix tablosundan alır. Pattern max{d₁, d₂} = max { 6 – 1, 2} = 5 kadar sağa kaydırılır. Bu durumda bad-shift tablosu daha ileri gitmemizi sağlamıştır. Son deneme de pattern’i text’te 6 tane başarılı karşılaştırmadan sonra bulur.

Pattern’in ilk bulunduğu noktayı tespit etmek için Boyer-Moore algorimasının worst-case etkinliği lineerdir. Bu algoritma özellikle geniş alfabelerde oldukça hızlıdır. Birçok insan doğal dil benzeri stringlerde bu algoritmanın daha basit sürümerini tercih eder. Ör: Horspool.

/// <summary>

/// Bad-shift tablosunu oluşturur

/// </summary>

/// <param name="pattern">Text'te aranacak kelime</param>

/// <returns>BadShift tablosunu döndürür</returns>

private static int[] BuildBadCharacterShift(string pattern)

{

int[] badCharacterShift = new int[352];

for (int c = 0; c < badCharacterShift.Length; ++c) //Her karaktere pattern lenght'ini ata

badCharacterShift[c] = pattern.Length;

for (int i = 0; i < pattern.Length - 1; ++i) //Patternde olan karakterlere sondan başlayarak karşılaşılan ilk konuma göre shift değerini ata

badCharacterShift[pattern[i]] = pattern.Length - i - 1;

badShift = badCharacterShift;

return badCharacterShift; //BadShift tablosunu döndür

}

Burada Horspool algoritmasındaki kaydırma tablosuna benzer şekilde bad-shift tablosu oluşturuluyor.

private static int[] FindSuffixes(string pattern)

{

int f = 0, g;

int patternLength = pattern.Length;

int[] suffixes = new int[pattern.Length + 1]; //Sonek dizisi initialize ediliyor

suffixes[patternLength - 1] = patternLength; //Son elemana patterin boyutu atanıyor

g = patternLength - 1;

for (int i = patternLength - 2; i >= 0; --i) //Pattern boyutu - 1 kadar dönülüyor

{

if (i > g && suffixes[i + patternLength - 1 - f] < i - g) //Karakter patternde tekrar ediyor mu

suffixes[i] = suffixes[i + patternLength - 1 - f];

else

{

if (i < g)

g = i;

f = i;

while (g >= 0 && (pattern[g] == pattern[g + patternLength - 1 - f])) //Karakter kendinden önceki karakterle eşitse

--g;

suffixes[i] = f - g; //Farkı tabloya ata

}

return suffixes; //Sonek tablosunu döndürüyor

}

Bu algoritma sayesinde good-suffix tablosunun oluşturulmasında kullanılacak sonekleri belirliyoruz.

/// <summary>

/// Good-shift tablosunu oluşturur

/// </summary>

/// <param name="pattern">Text'te aranacak kelime</param>

/// <param name="suff">Sonek tablosu</param>

/// <returns>GoodShift tablosunu döndürür</returns>

private static int[] BuildGoodSuffixShift(string pattern, int[] suff)

{

int patternLength = pattern.Length;

int[] goodSuffixShift = new int[pattern.Length + 1];

for (int i = 0; i < patternLength; ++i) //Tüm elemanlara pattern boyutunu ata

goodSuffixShift[i] = patternLength;

int j = 0;

for (int i = patternLength - 1; i >= -1; --i)

if (i == -1 || suff[i] == i + 1) //Karakter dizisi tekrar ediyor mu?

for (; j < patternLength - 1 - i; ++j)

if (goodSuffixShift[j] == patternLength) //Daha düşük sonuç varsa ata

goodSuffixShift[j] = patternLength - 1 - i;

for (int i = 0; i <= patternLength - 2; ++i) //Tabloyu doldur

goodSuffixShift[patternLength - 1 - suff[i]] = patternLength - 1 - i;

goodShift = goodSuffixShift;

return goodSuffixShift; //GoodShift tablosunu döndür

}

Good-suffix algoritması değişken olarak pattern ve suff[]’ı alıyor. Bu değerleri kullanarak good-suffix tablosu belirleniyor.

private static int BoyerMooreMatching(string pattern, string text)

{

int[] m_badCharacterShift = BuildBadCharacterShift(pattern); //Bad-shift tablosunu oluşturan methodu çağır

int[] m_suffixes = FindSuffixes(pattern);

int[] m_goodSuffixShift = BuildGoodSuffixShift(pattern, m_suffixes); //Good-shift tablosunu oluşturan methodu çağır

int index = 0;

while (index <= textLength - patternLength) //Text'in karşılaştırılacak son noktasına gelinmediyse

{

int unmatched;

for (unmatched = patternLength - 1; //Key comparison

unmatched >= 0 && (pattern[unmatched] == text[unmatched + index]);

--unmatched

)

if (unmatched < 0) //Pattern bulunduysa

{

return index; //Eşleşme konumunu döndür

}

else //Eşleşme sağlanamadıysa good ve bad shift tablolarındaki max değere göre indexi kaydır

index += Math.Max(m_goodSuffixShift[unmatched],

m_badCharacterShift[text[unmatched + index]] - patternLength + 1 + unmatched);

}

return -1; //Eşleşme yoksa

}

Knuth-Morris Prat arama algoritması

Knuth-Morris-Prat Bir kelimenin (yada Bir metin parçasının) Bir metin İÇERİSİNDE aranmasını sağlayan algoritmadır algoritması. Basitçe bu algoritmada Bir kelimenin aranan Metinde bakılması ziyaretinde bakıldığı yerde bulunamaması durumunda nerede olabilecegi Ile Ilgili Bir Bilginin Elde Edilmesi hedeflenir.

Algoritma aranan kelimenin, aranan Metinde bulunmaması durumunda, kelimenin içerisindeki harflerden yola çıkarak Birden Fazla ihtimali elemektedir.

Klasik Bir metin arama işleminde aranan kelime metindeki bütün, ihtimallerde denenir. (Örneğin Doğrusal arama (doğrusal arama) bu sekılde Çalışır). KMP algoritmasında imkb aranan metindeki bütün, ihtimaller denenmez. Bu Durumu anlamak Click Bir örnek Üzerinden algoritmayı inceleyelim:

KMP algoritmasının çalışması.

Örneğin metin Olarak:

ŞABCDŞADEFABŞADI

Aranan kelime Olarak da:

Sadi

Click KMP algoritmasının nasıl çalıştığını inceleyelim.

Öncelikle aranan kelime aşağıdaki sekılde ilk harflerinden karşılaştırılmaya başlanır ziyaretinde metin:

ŞABCDŞADEFABŞADI

Sadi

ilk on iki Harfin tutmasına karsilik 3. 4. harfler tutmamaktadır ettik. Algoritma benzemeyen ilk harf Olan 3. harfi bulunca geri kalanını benzetmeye çalışmaktan vaz geçer. AYRICA bakmış Olduğu harflerden hiçbirisi Aradığı kelime olmadigi Click Metinde Aradığı kelime boyu Kadar kayarak yeniden arama yapar.

ŞABCDŞADEFABŞADI

    Sadi

Yukarıdaki sekılde 4 harf kayarak D harfinden itibaren ODALAR VE DETAY arama YAPMAYA baslar göster çünkü Bir Önceki aramada, ilk 4 harf Arasında aranan kelimenin ilk harfi Olan Ş harfinin bulunmadığını anlamis ziyaretinde artık bu harflere bakmak gerekmediği sonucuna varmıştır.

4. harf Olan D harfi ile Başlayan Metinde, aranan kelime Olan sadi karşılaştırılmış ziyaretinde görülmüştür ki metin uymmamaktadır. Ancak aranan Metnin Bir Parçası Olan Kısmı üzücü göster buradaki aranan harfler arasındadır. dolayısıyla algoritma bu sefer 1 harf kaydırarak Ş harflerini alt alta getirerek deneme yapar ettik.

ŞABCDŞADEFABŞADI

     Sadi

Karşılastırma İşlemi sonucunda ilk ziyaretinde Vardır 3 harf tutmasına karsilik oğul harfte sorun karşılaştırılan harflerden hiç birisi aradığımız kelimenin baş harfi Olan Ş ile başlamamaktadır. Bu DURUMDA 4 harf Daha hareket edilerek Bir Sonraki karşılastırma İşlemi Yapılır Metinde:

ŞABCDŞADEFABŞADI

         Sadi

Karşılaştırmada başarı olmamasına karsilik oğlu harf Ş harfidir ziyaretinde dolayısıyla bu harfi Yakalamak Click 3 harf Daha kaydırılır:

ŞABCDŞADEFABŞADI

            Sadi

Bu kez başarı Elde Edilmiş aranan kelime bulunmuştur ettik.

Yukarıdaki örnekte dikkat edilirse Toplam 5 karşılastırma İşlemi Yapılmıştır. Bu Işlem Doğrusal arama algoritması ile yapılsaydı 12 karşılastırma gerekcekti. Bu anlamda KMP algoritmasının Daha Başarılı Olduğu söylenebilir.

Algoritmanın Performansı Olarak O (n) Değeri bulunabilir (n Metnin BOYUTU Olarak düşünülürse). Doğrusal arama ile Cardio sonucun Alındığı algoritma Performansı Click en kötü durum analizi Yapıldığı ziyaretinde en kötü DURUMDA Doğrusal arama ile Cardio olacağı unutulmamalıdır.

Arama algoritması Click pseudocode Açıklaması

Yukarıdaki örnekte algoritmasının Tüm Unsurları içermektedir. Şu an Click, bir "kısmi maç" tablosu varlığını varsayalım T tarif, aşağıda biz Şimdiki tek Bir uyumsuzluk biter durumunda Yeni Bir maçın başlama Click bakmak Gerekir nereye Gösterir. Girdileri T biz Başlayan bir maç Varsa o kadar INSA Edilmiş [M] karşılaştırırken Başarısız S [M + i] Click [i] B , bir Sonraki want maç endeksi başlayacak T [- m + II] Olarak S (yani, T [i] biz uyumsuzluğu Sonra yapmanız Gereken "yararlar" miktarıdır ). Bu on iki Etkileri Vardır: birincisi, T [0] -1 = Eger belirten, W [0] Bir uyumsuzluk, biz sarfınazar edemez ziyaretinde Sadece Bir Sonraki karakteri Kontrol etmelidir; ikincisi ettik, bir Sonraki olasi maç Rağmen baslar endeksi de m + I - T [i] , yukarıdaki örnekte Olduğu gibi, göster Aslında hiçbir, Kontrol GEREKMEZ T [i] bundan Sonra karakter, o yüzden gelen arama devam B [T [i]] . Aşağıdaki örnek Bir sözde kod KMP arama algoritması uygulanması.

algoritması  kmp_search :
      Giriş : 
        karakter dizisi, S (metin Arancak) 
        karakter dizisi, W (kelime Aradı) Çıktı : 
        Arasında Bir tamsayıdır ( sıfır Temelli W Bulunan edildiği S pozisyon)
    

    değişkenleri tanımlamak : 
        Bir tamsayı, m ← 0 (S geçerli maçın başında) 
        Bir tamsayı, ben 0 (W geçerli karakterin konumunu) ← 
        tamsayı dizisi, T (tablo Başka Bir yerde, hesaplanan)

    ISE 1 <uzunluk, (S) - m + ı mutlaka 
        Eger B [i] = S [M + i] Sonra 
            Eger i = uzunluk (W) - 1 Ardından 
                Dönüş m
              Izin i ← i + 1
          başka 
            Eger T [i]> -1 Sonra 
                Topçu Alay Komutanı m ← m + i - T [i] T ← [i]
              başka 
                Izin 0 ← m ← m + 1 i 
            
    (Burada Ulaşmak, biz Başarısız S Tüm arama var) DÖNMEK S uzunluğu

ARAMA algoritması verimliligi

Tablo Önceden var oldugunu varsayarak, T , Knuth-Morris-Pratt algoritmasının Ara bölüme sahiptir karmaşıklığı O ( n ) , n, uzunluğu S ziyaretinde O Olduğu Büyük O gösterimi . Giren ziyaretinde çıkan fonksiyonu Click katlanılan sabit Yükü Dışında, tum Hesaplamaları yapılmaktadır Süre döngü. Bu döngünün yineleme Sayısı Bağlı etmek; Bu gözlemlemek T İnşa böylece Başlamış Olan bir maç Eger [M] karşılaştırarak yaparken Başarısız S [M + i] Click B [I] , bir Sonraki want maç başlayacak Gerekir S [M +: (i - Ti [i])] . Özellikle, bir Sonraki olasi maç Daha YÜKSEK endeks meydana gerektiğini m böylece, T [i] <i .

Bu durum döngüsü tr Fazla 2 yürütebilirsiniz ima n ona tekrarda bu döngü on iki kolundan biri yürütür beri kez. ilk dalı değişmez artar i değişmez ziyaretinde m İndeksi, böylece m + ı , şu anda incelenip karakter S artar. İkinci şube ekler [i] T - i ıcın m onu met, gördüğümüz Gibi ettik, zaman pozitif Bir sayıdır. Böylece Konum m MEVCUT Potansiyel maçın başında artar. Ayni ZAMANDA, ikinci Bir dal Yaprakları M + l Click değişmemiş m Alir I - T [i] buna ilave etmek, Edildi ziyaretinde hemen Sonra T [i] Yeni Bir Değer Olarak atanmaktadır ziyaretinde i , dolayısıyla T [old_i] + T [old_i] = old_m + old_i - new_m + new_i = old_m + old_i . , döngü sona ererse şimdi M + = N ; Bu nedenle, döngünün ulaşılabilir tr onun dal n sırasıyla ya beri, zaman artırmak + i m ya da m ziyaretinde m ≤ m + i Eger: m = n , sonra kesinlikle m + i ≥ n , o göster çünkü böylece En birim artışlarla artar, biz olmalıydı i + m = n Bir is on a distinguished bu nedenle ziyaretinde Geçmişte onu on iki DURUMDA da biz bitmiş OLACAKTIR.

Böylece döngü En Fazla 2 çalıştırır n arama algoritması zaman karmaşıklığı oldugunu gösteren, Sureleri O ( n ).

İşte çalışma zamanı Düşünmek Click Başka Bir yoludur: Bize maç BAŞLAR diyelim B ziyaretinde S pozisyonunda i ziyaretinde s . Eger B Bir alt dize Olarak var S s, sonra [0..m] W = S [p..p + m] . Başarı Üzerine, bu kelime POZİSYONLARDA Eşleşen metin (Olduğu ziyaretinde [i] = S [p + i] W ), biz artırmak i metin de uymuyor Pozisyonları (ve kelime, yani başarısızlık Üzerine 1 ile W [i] ≠ S [p i + ] ) kelimesi işaretçi beligbli Bir miktar geri alınır imkb, metin işaretçisi, hala Tutulur ( i = T [i] , burada T atlama tablo), A.Ş. Biz maç girişiminde W [T [i]] ile S [p + i] . rulo -arka Sayısı i Tarafından sınırlanan i , O, söylemek biz başarısızlık Kadar ilerlemiştir gibi HERHANGİ Bir başarısızlık, biz sadece sadece geri Kadar dönebilirsiniz oldugunu. Sonra 2 Açıktır zamanı N .