SSE飽きた

とりあえず#ifdefの嵐になりながらもSSE化完了.
苦労したわりには「まだ全然遅いなぁ」くらいのレベルでしか高速化できていないが,とりあえず動くようになった.ってか,もうお腹一杯.

追記:昨日,帰宅した早朝に「あぁ,あそこのコードはこうやった方が速そうだ…」みたいなのを思いついて,メモしておいた.で,今日インプリしてみたら,けっこう速くなった.昨日までは「SSE4を使えば速いが,SSE3ではビミョー」みたいな状態だったのが,今はSSE3でも安定的に非SSEの2倍くらいの速さが出るようになった.とりあえず,これにて完了だな.もう疲れたからGPGPU化とかはいいや.