しつこくSSE

先週のお盆休みの間にSSE化に再挑戦したが,結果がおかしくなって挫折した.で,今日になって調べてみたら,コードがおかしいのではなくて,間違ったデータを喰わせていたことが判明.…おい.

正しいデータで調べたところ,それっぽい結果に.その後で細かいバグを修正して,ほぼ従来通りの結果が出るようになった.SSE化した部分については処理時間で25%程度の削減効果(←実用上は五十歩百歩のレベル).

いじっているうちに「あぁ,ここもSSE化した方が」みたいな部分が目について,いろいろいじっていたのだが,一応,後戻りできるように#ifdefで分けていたせいで,気付いたら #ifdef の嵐でコードが細切れになってしまい,ほとんどコードが解読不能(=自分でもメンテナンス不能)な状態になってきて,また途中で挫折.うーむ,ここは思い切って元のコードを捨てて最適化するべきか?(←いや,それは無いだろ)