みんなの「教えて(疑問・質問)」にみんなで「答える」Q&Aコミュニティ

こんにちはゲストさん。会員登録(無料)して質問・回答してみよう!

解決済みの質問

CPUの処理性能(クロックサイクルと演算回数)について

CPUの処理性能の計算について、わかる方のお知恵を貸してください。

http://journal.mycom.co.jp/articles/2010/01/03/supercomputer2010/index.html

の記事の中ほどに、以下の記述があります。

----------------------
POWER7はPOWER ISA2.0.6に準拠しており、コアあたり4個の積和演算器を搭載し、サイクルあたり8つの倍精度浮動小数点演算を行うことができる。現在のIntelのNehalemコアが4演算であるのと比較すると2倍の演算数で、次世代のSandy Bridgeの演算数を先取りしている。
----------------------

この、「4個の積和演算器で、サイクルあたり8つの倍精度浮動小数点演算を行うことができる」とは、このCPU(POWER7)の積和演算器は1サイクルで2つの倍精度浮動小数点演算を行うことができる仕様という意味でしょうか?

そもそも、1サイクル=2演算というのは、個々の演算器の仕様に問わず常識的な意味なのでしょうか?

投稿日時 - 2010-01-25 14:39:07

QNo.5621892

困ってます

質問者が選んだベストアンサー

「積和演算」がみそですな. これは
s = s + a*b
を計算することですから, 1個の積和演算器が 1サイクルで 1つの積和計算を行うことができるなら「積」と「和」で 2つの演算になります.
つまり「2演算」とはいってもそれは「積と和 (もしくは差) が 1個ずつ」という意味であって, この組み合わせ以外では 2演算にはなりません. 単純な a+b+c は 1サイクルにならないってのがポイントかも.

投稿日時 - 2010-01-25 15:56:03

お礼

レスありがとうございます。
積和の「ミソ」、的確に教えていただきありがとうございました。
ちょうどご回答いただいた後、ネット購入した「はじめてのCUDAプログラミング」という書籍が届き、読みはじめたのですが、同じように説明がありました。

書籍では、SP(演算プロセッサ)の動作が1.48GHzが240個あるGeForceの性能知、708GFLops(※2演算同時実行の場合)/1.06TFLops(※3演算同時実行の場合)と表現されていました。

「積和演算命令」(D=A×B+C)と「乗算命令」(C=A×B)同時が3命令との解釈でしたので、

「積和演算」の(1)A×B、(2)その結果+C、「乗算命令」の(3)A×Bで3演算同時で確かに成り立つのでスッキリです。

Tacosanさんのアドバイスでとても調べやすくなり、感謝です。

投稿日時 - 2010-01-26 08:57:49

ANo.1

このQ&Aは役に立ちましたか?

0人が「このQ&Aが役に立った」と投票しています

回答(1)

あなたにオススメの質問