Strassenov algoritmus

Strassenov algoritmus, pomenovaný podľa Volkera Strassena, je algoritmus na násobenie matíc. Oproti štandardnému algoritmu násobiacemu matice priamo podľa vzťahu z definície, s časovou zložitosťou , má Strassenov algoritmus o niečo lepšiu asymptotickú časovú zložitosť , čo znamená, že pre veľké matice je Strassenov algoritmus rýchlejší, než štandardný algoritmus.

Strassenov algoritmus nie je asymptoticky optimálny. Najrýchlejší známy algoritmus násobenia matíc, tzv. Coppersmithov–Winogradov algoritmus, má časovú zložitosť približne , ale vzhľadom na veľmi veľký konštantný faktor sa táto výhoda prejaví len pre extrémne veľké matice.

Algoritmus upraviť

Nech  matice typu   (v prípade, že matice nie sú typu  , je možné doplniť chýbajúce riadky a stĺpce nulami) nad okruhom  . Označme   súčin týchto matíc. Potom platí

 

kde   a   sú matice typu  , pričom z definície násobenia matíc vyplýva, že platí

 

Štandardný algoritmus možno ekvivalentne prepísať tak, aby násobil matice rekurzívne podľa uvedených vzťahov. Myšlienkou Strassenovho algoritmu je vypočítať hodnoty   pomocou iných ekvivalentných vzťahov tak, aby bol počet rekurzívnych volaní násobenia matíc menší (v prípade štandardného algoritmu 8 volaní, v prípade Strassenovho algoritmu len 7 volaní). Pri Strassenovom algoritme sa teda hodnoty   počítajú pomocou tzv. Strassenových vzorcov, ktoré obsahujú len 7 násobení matíc typu  

 

kde

 

Správnosť týchto vzťahov možno overiť úpravou uvedených maticových výrazov.

Pseudokód upraviť

Strassenov algoritmus možno zapísať pomocou pseudokódu nasledujúcim spôsobom:

function strassen(A,B,n,min)
    if n < min
       return standard_multiply(A,B)
    else
       m := n / 2
     
       A11 := A[1..m,1..m]
       A12 := A[1..m,m+1..2*m]
       A21 := A[m+1..2*m,1..m]
       A22 := A[m+1..2*m,m+1..2*m]
       B11 := B[1..m,1..m]
       B12 := B[1..m,m+1..2*m]
       B21 := B[m+1..2*m,1..m]
       B22 := B[m+1..2*m,m+1..2*m]
      
       M1 := strassen(A12 - A22,B21 + B22)
       M2 := strassen(A11 + A22,B11 + B22)
       M3 := strassen(A11 - A21,B11 + B12)
       M4 := strassen(A11 + A12,B22)
       M5 := strassen(A11,B12 - B22)
       M6 := strassen(A22,B21 - B11)
       M7 := strassen(A21 + A22,B11)
      
       C11 := M1 + M2 - M4 + M6
       C12 := M4 + M5
       C21 := M6 + M7
       C22 := M2 - M3 + M5 - M7 
      
       init(C)
       C[1..m,1..m] := C11
       C[1..m,m+1..2*m] := C12
       C[m+1..2*m,1..m] := C21
       C[m+1..2*m,m+1..2*m] := C22
     
       return C    
    end.

V uvedenom pseudokóde, A a B sú násobené matice, n je ich rozmer a min je minimálny rozmer matice, pre ktorý sa namiesto Strassenovho algoritmu použije štandardný algoritmus (potrebné na ošetrenie triviálnych prípadov, pri vhodnej voľbe min tiež možno podstatne zlepšiť čas výpočtu).

Časová zložitosť upraviť

Nech   je počet aritmetických operácií, ktoré vykoná Strassenov algoritmus počas násobenia matíc typu   Keďže pre   sa pri každom rekurzívnom volaní sa vyvolá presne 7 rekurzívnych volaní násobenia a 18 krát sa použije sčitovanie matíc, ktorého časová zložitosť je pre maticu typu   rovná   platí rekurentný vzťah

 

Pomocou základnej vety o rekurentných vzťahoch (Master theorem) možno vypočítať, že platí

 

To znamená, že asymptotická časová zložitosť   je lepšia ako   pri štandardnom algoritme. Výraz   však pri Strassenovom algoritme obsahuje podstatne väčší konštantný faktor, preto v praxi dosahuje Strassenov algoritmus lepší čas ako štandardný algoritmus len pre veľké matice.

Sú známe aj asymptoticky rýchlejšie algoritmy násobenia matíc, ako je Strassenov algoritmus, napr. Coppersmithov–Winogradov algoritmus má časovú zložitosť približne  . Konštantný faktor v   je však pri takýchto algoritmoch extrémne veľký, čo znamená, že Strassenov algoritmus dosahuje v praxi takmer vždy lepší čas.

Na druhej strane, najlepší známy dolný odhad časovej zložitosti algoritmu na násobenie matíc je  . Nie je však známy žiaden algoritmus, ktorý by násobil matice v tomto čase.

Literatúra upraviť

  • Aho, A. V.; Hopcroft, J. E.; Ullman, J. D.: The Design and Analysis of Computer Algorithms. Addison-Wesley, 1974.
  • Cormen, T. H.; Leiserson, Ch. E.; Rivest, R. L.; Stein, C.: Introduction to Algorithms (2nd ed.). MIT Press and McGraw-Hill, 2001.
  • Golub, G.; van Loan, C.: Matrix computations (3rd ed.). London: The Johns Hopkins University Press, 1996.

Pozri aj upraviť

Externé odkazy upraviť