5ちゃんねる ★スマホ版★ ■掲示板に戻る■ 全部 1- 最新50  

■ このスレッドは過去ログ倉庫に格納されています

CPUアーキテクチャについて語れ 20

1 :Socket774:2011/10/09(日) 07:44:30.45 ID:5eARzG3b
おいお前らいい加減、無能なAMD房・Intel房・GKに振りまわされず、
エンコ時間がどうとかPIがどうとかPS3がどうとかじゃなく、
CPUコアのアーキテクチャについて語りましょう。

x86/RISC/CISC/スーパースカラ/VLIW/MIMD/SIMD
等について語ってもよし、
各SPUの汎用レジスタ128本のCell B.E.マンセー、
x86なワンチップスパコンのLarrabeeマンセー、
時代はGPGPUだ!、Sunは漢の浪漫!、龍芯(笑)、
昔々8086の時代は(以下略・・・等もよし。

さあ、不毛な争いを止めてCPUアーキテクチャについて語ろう!

前スレ
CPUアーキテクチャについて語れ 19
http://hibari.2ch.net/test/read.cgi/jisaku/1305200489/

2 :Socket774:2011/10/09(日) 08:34:43.13 ID:pd6B4c1l
>>1のつ

パッケージはDIPで頼むわ
1000ピン超のDual inline packageは今にも動き出しそうでかっこいいぞ

3 :Socket774:2011/10/09(日) 11:20:27.88 ID:RmdgPw4r
>>1乙。

ヘテロジニアスマルチコアマンセー。

4 :竹島は日本領土:2011/10/09(日) 17:31:28.47 ID:ZNb+V1Ri
Qualcomm's New Snapdragon S4: MSM8960 & Krait Architecture Explored
http://www.anandtech.com/show/4940/qualcomm-new-snapdragon-s4-msm8960-krait-architecture

5 :Socket774:2011/10/12(水) 23:21:04.12 ID:KaJQiQDm
492: Socket774 [sage] 2011/10/12(水) 15:24:37.43 ID:rgns2cVw (8)
国内レビュー

AMD FXシリーズ最上位「FX-8150」ベンチマーク
http://pc.watch.impress.co.jp/docs/topic/feature/20111012_483000.html
遂に姿を現した8コアCPU「AMD FX」はCPUの覇権を握れるか?
http://ascii.jp/elem/000/000/641/641601/
Bulldozerは気難しい──AMDの新CPUアーキテクチャ“Zambezi”を試す
http://plusd.itmedia.co.jp/pcuser/articles/1110/12/news041.html
「FX-8150」レビュー(前編)。ついに発進するBulldozer世代のCPU「Zambezi」はゲーマーの福音となるか
http://www.4gamer.net/games/100/G010000/20111012001/
Bulldozer世代の8コアCPU「AMD FX」"Zambezi"徹底攻略 - 性能ベンチマーク編
http://journal.mycom.co.jp/special/2011/zambezi/index.html

6 :,,・´∀`・,,)っ-○○○:2011/10/14(金) 01:06:02.24 ID:yly8pXmE
デニス・リッチー死去・・・

7 :Socket774:2011/10/15(土) 00:37:55.49 ID:+GoXuSGa
この記事を読んでて今更気付いたんだけどBulldozerのトランジスタ数が20億っておかしくない?

ttp://www.xbitlabs.com/news/cpu/display/20111013232215_Ex_AMD_Engineer_Explains_Bulldozer_Fiasco.html
>AMD publicly said that each Bulldozer dual-core CPU module with 2MB unified L2 cache contains 213 million transistors and is 30.9mm2 large.
(中略)
>As a result, all four CPU modules with L2 cache within Zambezi/Orochi processor consist of 852 million of transistors and take 123.6mm2 of die space.
>Assuming that 8MB of L3 cache (6 bits per cell) consist of 405 million of transistors,
> it leaves around whopping 800 million of transistors to various input/output interfaces, dual-channel DDR3 memory controller as well as various logic and routing inside the chip.

Tukwilaの総トランジスタ数が約20億なんだけど、そのうちの大部分に当たる14.2億は24MBのL3キャッシュに費やされてるんだよね。
一般にアンコアと呼ばれる部分(12ポートのクロスバ、2MBのディレクトリキャッシュ、QPIとFBDのI/Fとコントローラー)のトランジスタ数はわずか1.95億しかない。
粗っぽく仕様を比較するとこんな感じで、明らかにTukwilaのアンコアはBulldozerよりリッチなのでBulldozerがTukwilaの4倍以上もここにトランジスタを費やしてるとは思えないんだが。
Bulldozer … 4M, On-Chip-Memory 16MB(L3$ 8MB), HT 4ch, DDR3 2ch
Tukwila … 4C, On-Chip-Memory 30MB(L3$ 24MB) QPI full*4 + half*2, FBD 4ch,, Directory Cache 1MB*2

8 :Socket774:2011/10/15(土) 01:16:53.86 ID:+GoXuSGa
あ、ごめん。記事をちゃんと読まずに脊髄反射で書きこみした。xbitもBulldozerの20億は多すぎるって言ってるのね。(そこから設計に不備がある可能性を指摘。)

9 :Socket774:2011/10/15(土) 03:56:38.28 ID:NhgPmXsG
なんか面白い話が出てきたな
http://northwood.blog60.fc2.com/blog-entry-5351.html
Bulldozerが遅いのは手作業をやめて自動設計ツールに頼ったのが原因らしい

10 :Socket774:2011/10/15(土) 04:47:59.92 ID:+GoXuSGa
xbitの作文をスルーして読んだらアンコアが悪いとか、どうもそういう単純な話じゃなさそうだな。
AMDが本格的にファブレス企業へなってしまったような印象を受けた。
ttp://www.insideris.com/amd-spreads-propaganda-ex-employee-speaks-out/
Bulldzerは紙(企画書?)の上では素晴らしいチップだった。俺はBulldozerの物理設計が始まる前〜物理設計中の時期にAMDで働いてたんだ。
俺に言えるのはBulldozerはそれ自体の魅力も薄ければIntelに対する競争力も無いってこと。
(何故なら俺はAMDの設計手法が全く駄目だと確信しているから。)
俺がAMDで働いてた頃、Bulldozerに何が起きたかは語りたくもないんだが…

何が起きたかって言うと、経営陣はクロスエンジニアリングを決定したんだ。
これは手作業でのCPUの設計を止めてSoCの設計手法へ移行しろってことだった。
この結果、パフォーマンスやダイサイズや効率性について色々諦めなきゃならなかった。 (DECのところ省略)
今までIntelとAMDは少なくともクリティカルな部分については常に手作業で設計してきた。
だがそれは俺の退社前には変わっちまった。AMDは論理合成、フロアプラン、配線等の自動化ツールに頼り始めてたんだ。
俺はAMDを辞める前の数年間は設計フローの部署に居た。
そこでツールベンダの要望に応えて自動化ツールを使った加算器や乗算器などの試験的なデザインをしたよ。
ツールのパフォーマンスを引き出すために色々な手を講じたけど、毎度ツールから産まれる機能ブロックは、
手作業で設計したものと比べて2割大きくて2割遅い上にエレクトロマイグレーション等の問題を抱えた代物だった。

これが今のAMDの設計手法さ。さぞかし立派な物が出来るに違いないね。

11 :Socket774:2011/10/15(土) 05:39:33.95 ID:0EucyfqB
CPUアーキテクチャについて語れ 16
http://pc11.2ch.net/test/read.cgi/jisaku/1253517890/

587 名前:MACオタ[sage] 投稿日:2010/02/14(日) 03:24:04 ID:Wj71GeXX [1/17]
(略)
- The only bad thing is that some guys I know at AMD say that Bulldozer is
 not really all that great a product, but is shipping just because AMD
 needs a model refresh. "Sometimes you just gotta ship what you got."
 でもなぁ… AMDのツレが言うにはAMDは製品サイクルに切迫して製品化
 してくるらしいんだよな。「何でもいいから今出来てるのを出さなきゃいけない
 時もあるんだよ」って。


ここら辺のことって自動配線の話だったのかな

12 :Socket774:2011/10/15(土) 05:58:36.78 ID:whlisdOx
まあベンチ結果があれだし
製造技術で差をつけられてるのに設計まで放棄したら
馬鹿でも結果が分かる
とはいえGPU統合まで考えるとまだまだAMDは捨てたもんじゃないが

13 :Socket774:2011/10/15(土) 06:36:54.16 ID:ulnDUdfZ
ほうほう、なかなか興味深い
設計で手抜きとは…こっから手作業で取り戻せるのかね

14 :Socket774:2011/10/15(土) 08:16:29.60 ID:HTRKNxsH
意図的に手を抜いたならまだいい。
クリティカルな部分すら自動化ツールに頼らなければならない状況になってなければいいが。

15 :Socket774:2011/10/15(土) 10:41:48.53 ID:+GoXuSGa
Hot Chips 22 - AMDの小型、低電力CPUコア「Bobcat」
ttp://journal.mycom.co.jp/articles/2010/09/02/hot_chips22_bobcat/index.html
>Bobcatの設計ターゲットの第一は電力、チップ面積が小さいこと、2番目が高い性能であるが、その次にカスタム設計のメモリなどの種類数を少なくして、
>プロセサコアの大部分を論理合成で作れるようにすること、そしてプロセスが変わっても容易に移行できることが挙げられている。
>
>Bobcatコアを使用する最初の製品である「Ontario」はTSMCの40nmプロセスを使うと見られているが、関係の深いGLOBALFOUNDRIESのプロセスへの移行も視野に入っていると思われる。

そしてAMDがBulldozerの後継コア(Piledriver)をTSMCでも生産するという噂が…
ttp://www.techpowerup.com/153567/AMD-to-Turn-to-TSMC-for-Bulldozer-Manufacturing.html

16 :Socket774:2011/10/15(土) 12:07:30.21 ID:sWyGoRQ1
K10あたりからあのクラスのCPUは本格的にAMDの開発リソースでは手に余るようになってきてるんだろうな

やっぱりK10のデコーダとかロードストアとかキャッシュ周りを順当に改良していった方が
良かった気がするんだがそれじゃ駄目なんかね?

K10ってノースブリッジのクロック上げるだけで性能豹変するらしいし
まだいけそうな気がするんだけどなぁ

17 :Socket774:2011/10/15(土) 12:10:10.02 ID:gWGsaGjK
xbit記事の手作業or自動設計という対立軸はどうなんだ?
ふつー自動設計ツール&人力カスタムで造り上げていくもんだろ。

長年のノウハウがあるTSMCと比べてGFから提供される
各種デザインキットがショボかった可能性はありそうだが・・・。

18 :Socket774:2011/10/15(土) 13:20:09.87 ID:72p6jp6o
>>17
失敗したのを確認してから出てくるような自称5年前までの元社員の投稿に
どれほど意味があるのかは、まあ読み手次第だが。

19 :Socket774:2011/10/15(土) 13:33:28.28 ID:+GoXuSGa
>>17
この人がAMDに勤めていたと思われる時期はまだFabが売却されてGFになってないのでGFのデザインキットは無関係。
ツールを購入してテストしていたというくだりからするとAMDは社内製ツールをある程度諦めたっぽい。

>>18
記事になったのは2日前だけど投稿自体は1年以上前のものだった。
ttp://forums.macrumors.com/showpost.php?p=9745462&postcount=612
Bobcatも同様な設計をされていることは知らなかったみたいだね。

20 :,,・´∀`・,,)っ-○○○:2011/10/16(日) 04:27:05.81 ID:arCmCIWG
ふつうは守秘義務で退職後5年間は口外してはいけないことになっている

21 :Socket774:2011/10/16(日) 04:27:51.80 ID:lKlxp30A
http://www.theinquirer.net/inquirer/news/2116600/intel-8nm-wont-exascale
このままのやり方では2018年に8nmまで行ってもエクサスケールのスパコンは出来ませんよ

http://www.theregister.co.uk/2011/10/14/intel_predicts_continued_life_for_moores_law/
ハイパフォーマンス向けCPUの上にDRAMを積層させるとCPUの熱でDRAMはまともに動きませんよ
(つまりDRAMは別に積層させ、それとCPUを繋ぐHMCのようなものが必要ですよってこと?)

22 :,,・´∀`・,,)っ-○○○:2011/10/16(日) 04:44:59.99 ID:arCmCIWG
> Bobcatも同様な設計をされていることは知らなかったみたいだね。
Atomより小さいのに性能がいいとかいいたいんだろうけど
CPUコア自体はAtomのほうが遙かに電力効率はいいんだぜ

N/Dシリーズが残念なのはチップセットがAtomに最適化されていないから。

23 :Socket774:2011/10/16(日) 05:24:40.78 ID:1J/5fE5h
>>21
後藤さんはIntelはDRAMの上にCPUを載せる方向を考えているって書いてたよ

24 :Socket774:2011/10/16(日) 09:20:07.18 ID:duuL/4ob
追加
AMDのデザイナーであるJerry Moenchが2004年のVLSIで「リソースの少ないAMDは自動化ツールに頼る必要があるのでK8とK9の配線層数は非常に多くなる。」という発言をしていたらしい。
ttp://arstechnica.com/civis/viewtopic.php?p=10607812#p10607812

>>22
AMDのトレンドがそうなりつつあったのかなと思っただけでそれ以外の意図はない。

25 :Socket774:2011/10/16(日) 10:01:55.99 ID:lKlxp30A
Bulldozerは11層
Bobcatは10層
>>24の話は今回の件に関しては関係無くね
昔からIntelの方が配線層は1,2層少なかったからそのことだと思うけど

26 :Socket774:2011/10/16(日) 10:07:58.41 ID:duuL/4ob
そして昔からIntelのキャッシュは速かった。

27 :Socket774:2011/10/16(日) 12:16:55.20 ID:XTNiHNmW
えっ?w

28 :Socket774:2011/10/16(日) 15:33:29.54 ID:NjkXCo1L
同じ自動化でもBobcatの方は目に見えるようなアンコアの無駄がないから
AMDから引き継いだGFの設計ツールの方がTSMCのより劣っているじゃないのか?

29 :Socket774:2011/10/16(日) 19:58:55.07 ID:inoe90w3
ボブはデュアルだから4M8Cのブルと比べてもな

アイドル見る限りGFの32nmは優秀っぽいからそこだけ救いかね
まぁ歩留まりはいつものAMDみたいだが

30 :Socket774:2011/10/16(日) 20:59:20.13 ID:NjkXCo1L
K8のデュアルの頃から同じアンコアの無駄あるから

31 :Socket774:2011/10/16(日) 21:24:59.36 ID:fCUXbMeg
>>23
後藤さんのIDFレポートで、CPUの上に載せる構想はフェイクだったと言ってる。

http://pc.watch.impress.co.jp/docs/news/event/20110920_478686.html
----
Intelは、これまでDRAMスタックの上にCPUを載せた構想図を示してきたが、それはフェイクで、
実際にはキューブメモリの共同開発を進めていたことがIDFで明らかになった。

32 :Socket774:2011/10/17(月) 01:28:09.67 ID:tXXGEmNb
つーことは>>21の方針ということだね。

33 :Socket774:2011/10/17(月) 12:45:22.65 ID:Qb1Z2fwV
>>31
スカイネット…

34 :Socket774:2011/10/17(月) 23:33:58.98 ID:oiNLt3WA
>>31
インテルが忍者プログラマなどと言うかww
http://pc.watch.impress.co.jp/img/pcw/docs/478/686/16.jpg

35 :Socket774:2011/10/17(月) 23:43:42.05 ID:tXXGEmNb
>>34
これ、何度見ても吹くw

36 :Socket774:2011/10/21(金) 10:54:18.31 ID:swxSwYAF
マイクロソフト、次世代機「Xbox Next」を2013年ホリデーシーズンに投入か
http://www.inside-games.jp/article/2011/10/21/52256.html

ソニー、プレイステーション4向けのプロジェクトを複数の内部スタジオで開始か
http://www.inside-games.jp/article/2011/10/21/52257.html

37 :Socket774:2011/10/22(土) 08:30:40.15 ID:WXy0l5/4
当然研究開発はするでしょう。PS3は10年もたせると言っていたから、
新箱が2013年末ローンチなら、PS4は1年後の2014年末ローンチでその位だが…

The Cell processor 2 is in development, and go for PlayStation 4
http://translate.google.es/translate?sl=es&tl=en&js=n&prev=_t&hl=es&ie=UTF-8&layout=2&eotf=1&u=http%3A%2F%2Fwww.anaitgames.com%2Fnoticias%2Fchip-cell-2-playstation-4

38 :Socket774:2011/10/22(土) 09:49:55.09 ID:khfWeJNr
Cell 2 そんなものが存在するのだろうか・・・

39 :Socket774:2011/10/22(土) 11:24:37.20 ID:taA5UawY
まあSPEを乗せないと話にならん

40 :Socket774:2011/10/22(土) 12:39:23.57 ID:tJPrvzew
PS4はPS2の機能を最実装して欲しいよ。

41 :Socket774:2011/10/22(土) 13:51:29.05 ID:U8K0kVfc
エミュでいいと思うが、任天堂が特許とってたな…。

42 :Socket774:2011/10/22(土) 14:33:32.67 ID:ENHfY00V
2014年までひっぱるならSPEもソフトエミュでの再現が視野に入ってくるのでは?

43 :Socket774:2011/10/22(土) 14:55:02.22 ID:MAhgU7wM
ゲハが来ると如実にレベルが下がるな

44 :Socket774:2011/10/22(土) 14:58:26.58 ID:gkhHBwkF
CellはGPUと違って好きに叩かせてるらしいから
互換を優先するなら載せてくるだろうけど
PS3のように敢えて載せず、PS2を16000円で売るような事もやるだろう
まあ投資額としてはPS4にも載せるつもりだったと思うけど

45 :Socket774:2011/10/22(土) 16:24:00.70 ID:1URor+rl
今頃何言ってるんだっていわれそうだが、時分割で高速に切り替えて
実効的に回路規模数倍相当になるFPGAを売ってるベンチャーがあるんだな

ttp://www.kumikomi.net/archives/2010/06/co13de13.php
ttp://eetimes.jp/ee/articles/1110/18/news125.html

46 :Socket774:2011/10/22(土) 18:31:44.02 ID:vFNOAi9C
すげーな、これ。

47 :Socket774:2011/10/27(木) 13:14:14.67 ID:EqjWh8zl
ARM+SPEでPS3のゲームを動かすときだけARMでPPEをエミュでもすりゃいいんじゃないかと
暴論

48 :Socket774:2011/10/27(木) 18:39:29.88 ID:+a53G7Tz
手堅い
いまどき新PPEを作ったりSPEを他コアでエミュるよりは

49 :Socket774:2011/10/27(木) 19:17:38.67 ID:d4vvlLlg
どこが手堅いんだかさっぱりわからん
WiiUや次期XboxもPowerだしSPEつけるならPS3との互換性捨ててARMにする意味が全く無い

50 :Socket774:2011/10/27(木) 21:05:14.90 ID:+a53G7Tz
WiiUは45nmで低消費電力志向だと判ってるから
現行世代のスループットをターゲットにしたコアだろ?
MSはAMDのSoCになるらしいからPowerじゃないんじゃないか?

51 :Socket774:2011/10/27(木) 21:08:58.22 ID:+a53G7Tz
ARMなら効率も設計自由度もコストも市場環境的にも優位
最新技術をキャッチアップしたいならARMを使うのも手堅い

これからIBM自体がARMに走ってもそれほど驚かないくらい

52 :Socket774:2011/10/27(木) 21:12:02.00 ID:+a53G7Tz
>>50
現行世代並みのスループット

53 :Socket774:2011/10/27(木) 21:14:38.26 ID:sGYvlMJa
ARMは魔法のアイテムじゃないぞ

54 :Socket774:2011/10/27(木) 21:15:29.88 ID:+a53G7Tz
もちろん
だがIBMも魔法使いじゃないしな

55 :Socket774:2011/10/27(木) 22:04:14.78 ID:d4vvlLlg
>>50
現行の箱もAMDが統合設計したCPU+GPU1チップコアだし
GFはIBMのプロセスグループだからPowerコアの設計変えずにSoC化するのに有利だろ

56 :Socket774:2011/10/27(木) 22:18:12.76 ID:BkS80NSl
次世代箱はFSAでプログラミングするんだろうか。

57 :Socket774:2011/10/27(木) 22:29:42.34 ID:+hQYM3Yu
Cell2ではPPEはお払い箱になってARMに変わるのは決定済みだよ。
ttp://blog.esuteru.com/archives/2510625.html

ARMはIBMと共同開発しているから、IBMにとっては技術の横展だね。
IBMにとってCellでの用途開発で苦しんだのは黄犬Linuxが絶滅種寸前だった
からで、ARMでWindows8が走ると用途が広がるからね。SPE自体のコンパイラは
IBM謹製でお手の物だし、ARM/SPEのマルチCPUはすごい事になりそう…
あと、CPUチップ内でのARMのバスとIBMのバスは接続技術を開発済みだよ。
ARM/SPEの構成ならARM用とIBM用の各周辺回路のどちらでも使えるみたい。

58 :Socket774:2011/10/27(木) 22:38:29.25 ID:BkS80NSl
おお、そうなのか。

59 :Socket774:2011/10/27(木) 22:46:35.77 ID:yC3sUmy2
>>57
乞食クズブログのURL貼るなボケ

60 :Socket774:2011/10/27(木) 22:47:57.13 ID:JrjwHkPq
その内容だとcell2じゃなくて
armの何かだろ

61 :Socket774:2011/10/27(木) 23:09:47.57 ID:lsXw4+Im
ARM+SPEだけど・・・読めない人はどう読んでんだ?

62 :Socket774:2011/10/27(木) 23:10:53.04 ID:+hQYM3Yu
>>60
医療とか防衛とかスパコン用にはPPEは全然役に立ってなくて、SPEの命令役
だったからね。ARMもその位置だが、Cellの時はPPEの動かし方がうまくいかず、
intelチップでWindowsを動かし、そこからPPEに命令を出し、PPEがSPEに命令
する形だったし。
面倒くさいからMercuryもCellをやめたみたいだけど…
http://www.mc.com/cell/

63 :Socket774:2011/10/27(木) 23:39:47.26 ID:/cZ9SvRl
非力すぎて使えないPPEをもっと非力なARMで置き換えるのか

64 :Socket774:2011/10/27(木) 23:44:37.04 ID:U+QpyrCB
もうPS3除いてCell事業は終息してるし、ゲーム機も2014年まで先延ばしなら
ゼロベースで考えたほうが良い。少なくともSPEは互換のためだけで拡張すべきではない。

65 :Socket774:2011/10/28(金) 03:48:42.60 ID:uxT0py/S
どこにARM+SPEってかいてる?

66 :Socket774:2011/10/28(金) 09:15:10.73 ID:bVCzwYja
ARM+SPUとか意味ねーから。
ゲハは自分の無知をまず認識しろ

67 :Socket774:2011/10/28(金) 12:57:48.02 ID:Ebk/AFh4
Cortex-A7 こっちが面白そうだ
ttp://pc.watch.impress.co.jp/docs/column/kaigai/20111028_487030.html

68 :Socket774:2011/10/28(金) 18:21:48.03 ID:ykbIX3om
64bitの新命令セットARMv8きたがな

69 :Socket774:2011/10/28(金) 19:28:17.59 ID:ANkZ9EDu
ARMv8は2012、3年頃にチップが登場して
2013、4年頃には搭載された製品か

70 :Socket774:2011/10/28(金) 19:29:12.41 ID:ANkZ9EDu
新市場開拓なら名称もCortexから変わりそうだな

71 :Socket774:2011/10/28(金) 21:39:37.63 ID:ISgdXLYI
これか。もう最初のモデルとコンパイラが出回っているのか。
http://www.electronista.com/articles/11/10/27/arm.explains.armv8.chip.architecture/

72 :Socket774:2011/10/28(金) 21:58:03.65 ID:8J0wjmaF
そろそろメモリが4GB超えるから移行しただけじゃね
ARMで変わるならOpenSPARCで変わってただろ

73 :Socket774:2011/10/29(土) 00:08:37.56 ID:vGX3+EAr
ARM始まったな。

74 :Socket774:2011/10/29(土) 19:26:36.33 ID:iNqdvA4W
PowerコアはWiiUで終わりなのか さびしいのう

75 :Socket774:2011/10/30(日) 00:31:26.92 ID:wSXfHyUw
http://www.arm.com/files/downloads/ARMv8_Architecture.pdf
命令長は32bit固定で、レジスタフィールドは5bitか

76 :Socket774:2011/10/30(日) 03:35:40.78 ID:K7d+RoXx
へーレジスタ増やすんだ
普通のRISCになったな

NEONは従来の128bitx16 or 64bitx32ではなくて
下位ビットのみ共有して128bit or 64bit x32になるということね

77 :Socket774:2011/10/30(日) 10:54:29.95 ID:2xBo3Uq2
☆ARMの次世代core, SoCについて語るスレ #001☆
http://hibari.2ch.net/test/read.cgi/jisaku/1319938708/

とりあえず建てといた。

78 :Socket774:2011/10/31(月) 00:13:57.64 ID:Zmdm7KSJ
ARMv8
ttp://pc.watch.impress.co.jp/docs/news/event/20111031_487621.html

79 :Socket774:2011/10/31(月) 00:20:01.30 ID:hSXKN7Rt
命令長32Bitとな


80 :Socket774:2011/10/31(月) 01:39:39.59 ID:71p1k9kP
別に普通じゃね
PPCもMIPSもSPARCも命令長32bitだ

条件実行フィールド削る分でレジスタフィールド拡大するんだろうな

81 :Socket774:2011/10/31(月) 06:19:51.08 ID:R14/KgF7
>>78
>AMCCの発表によると、「X-Gene」の最大動作周波数は3GHz、待機時消費電力は300mW未満。
300mW未満に笑った。これはプロセッサコアのIdle powerを単純にコア数倍してるだけだね。
サーバープロセッサのIdle powerはほとんどがコア以外の成分だからこんなに減らせない。
1コアのIdle powerを約10mWとすると32コアくらい積んでくる予定かな?

82 :Socket774:2011/11/02(水) 18:02:31.93 ID:qtcEsICV
理研と富士通のスパコン「京」、10ペタフロップスを達成
http://www.rbbtoday.com/article/2011/11/02/82634.html

83 :Socket774:2011/11/02(水) 18:54:29.83 ID:2sy8VIVP
>>82
http://pr.fujitsu.com/jp/news/2011/11/2-1.html

CPUが増えて速度が上がっているのに実行時間が前回よりも長いということは、
前回よりもサイズの大きい計算をしたんだな。

84 :Socket774:2011/11/02(水) 18:58:11.90 ID:2pf8QHcu
紆余曲折有ったけどよくやったな
次の世代はどうなるのかな

85 :Socket774:2011/11/02(水) 19:44:05.62 ID:EbMxVKzY
ありません

86 :Socket774:2011/11/04(金) 02:36:55.25 ID:DcmrmQit
スーパースカラとマルチコアは、どっちもパイプラインを複数用意してますが
「パイプライン」≠「コア」ならコアは具体的にどの部分を指してるんですか?
制御部のことかなって思いましたが、スーパースカラも各々のパイプラインを制御する
制御部は必要だと思うので違う気がしました。

87 :Socket774:2011/11/04(金) 04:01:38.52 ID:QCGb5Kp8
>>86
一番簡単な考え方はこんなもんか?

スーパースカラー …… ステージを分割しユニットを複数実装することで「1つのスレッド」を並列実行するための技術
マルチコア …… 入力から出力までの1単位であるコアを複数実装し「複数のスレッド」を独立して並列実行するための技術
SMT(HTT) …… スーパースカラーを拡張することで「複数のスレッド」を並列実行しているかのように見せる技術

パイプラインとコアの違いは直列か並列かと処理できる能力の違いだね。
パイプラインはベルトコンベアで作業する人間1人で、コアはそのコンベア1本って感じ。

88 :Socket774:2011/11/04(金) 05:27:58.84 ID:gUSV43lT
>>87
なるほど、スレッドの数の違いですか。
並列処理のハザード検出とか大変だろうな(多少は必要でしょうけど)
と思ってたのですが、別々のスレッドならそれほど心配しなくてもよさそうですね。
とてもわかりやすい説明有難うございますm(_ _)m

89 :Socket774:2011/11/04(金) 14:33:21.18 ID:tsu7Pvfb
AMD、大規模なリストラを実施

http://pc.watch.impress.co.jp/docs/news/20111104_488639.html

さようならAMD

90 :Socket774:2011/11/04(金) 16:50:40.03 ID:Moxb7+zr
うわぁ・・・

91 :Socket774:2011/11/05(土) 05:39:27.19 ID:knogqZxw
一つの時代が終わったな。今後はIntel対ARMが本格化するのだろうか。
生産に関してはどうか。AMDを主要顧客としていたGFはどうするのだろうか。

92 :Socket774:2011/11/05(土) 07:09:13.26 ID:oux3Fupy
>>91
逆に危機感を持って本気出して来るってことは考えられないかな?頑張って欲しいな

93 :Socket774:2011/11/05(土) 09:15:27.13 ID:nSjbwRr9
求人する>有能さを見極める>リストラする というサイクルを
回して有能な人間の濃度を高めているだけなのでは

94 :Socket774:2011/11/05(土) 09:23:28.85 ID:3hTz23j3
>>93
社会に出てみるのをオススメしておく

95 :Socket774:2011/11/05(土) 09:30:01.01 ID:6H1oJD1y
日本企業と米国企業でリストラの意味がだいぶ違うことを社会人なら知っておくべきw

96 :Socket774:2011/11/05(土) 12:32:46.28 ID:w3HSRgUz
リストラは首切りを意味する和製語なんだよ!!なんだtt

97 :Socket774:2011/11/05(土) 13:51:59.22 ID:JUY1imzA
またの名は構造改革

98 :Socket774:2011/11/05(土) 14:13:11.82 ID:grJTobZV
業績好調なのに大量首切りやった会社は例外なく落ちぶれてる。

99 :Socket774:2011/11/05(土) 14:18:35.80 ID:Jm1rArRd
え、今は落ちぶれてないの?

100 :Socket774:2011/11/05(土) 14:59:59.36 ID:6H1oJD1y
大量首切りなんて業績好調な大企業なんて普通にやってんだろ。
新卒3000人採用、数ヶ月後2000人削減

101 :Socket774:2011/11/05(土) 15:35:46.59 ID:9ww8bgSH
例外なく落ちぶれるww
Intelだってリストラやったことあるけどね

新CEOが就任して注力する部分が決まったからそれ以外の贅肉はそぎ落とすということでしょ
そぎ落とす部分が本当にいらないのかどうかは分からんけどね
2月のAnalyst Dayで方向性は見えてくるんじゃない

102 :Socket774:2011/11/05(土) 16:56:21.98 ID:hN4Jy1Vp
インテルが1万人レイオフを行ったときは
Core2で挽回し始めていて、その裏でNehalemアーキ開発も進んでいた

今のAMDは……

103 :Socket774:2011/11/05(土) 17:17:33.74 ID:gqLPNyoW
空っぽだな

104 :Socket774:2011/11/05(土) 19:41:18.38 ID:xAARp2gD
10%って何人なんだろうね

105 :Socket774:2011/11/05(土) 20:35:14.97 ID:Wjwrq41X
10年度の時点で16000人か。ということは1600人。
何か撤退する分野があってそこを切るのか?

106 :Socket774:2011/11/05(土) 20:42:56.94 ID:xAARp2gD
centaurが16社できるぞ

107 :Socket774:2011/11/05(土) 21:21:53.72 ID:3hTz23j3
AMDの製品ラインの中で、現在から将来に渡ってダメなのは
どうみてもBulldozerなんだが、
ここ手放すと終焉が見える。

108 :Socket774:2011/11/05(土) 22:07:51.09 ID:TcWmJEa8
>>102
Intelのリストラが話として出てきたのは2004年じゃないか?ちょっと記憶が怪しいが。C2Dの前なのは確か。
ただしエンジニア(R&D)は減らさず逆に増強されたはず。
あの頃はOpteronにやられてたから価格競争に耐えられるような組織作りを迫られてたんだよな。
リストラの実施とPentiumDの価格改定が重なった2006年の第2四半期は大きく業績を落とした。
ただリーマンショックの時には既に組織改革が粗方終わってたので上手く乗り切れたね。

109 :Socket774:2011/11/05(土) 23:15:05.74 ID:O0U6bSI1
http://www.computerworld.jp/news/trd/48230.html

110 :Socket774:2011/11/06(日) 00:06:26.80 ID:Nt3idcCl
ごめん、2004年は大嘘。
Intelが2006年の第1四半期に前年同期比で4割ほど減益だったのが始まりっぽい。
ttp://www.intel.co.jp/jp/intel/pr/press2006/060420a.htm

決算の発表から一週間後に投資家へリストラによる経営体質の改善を約束。
ttp://news.cnet.com/Intel-to-get-widespread-restructuring/2100-1014_3-6065708.html
>The comprehensive project, which will look at ways to cut costs per unit and improve employee productivity, will take place over the next 90 days, he said.
(略)
>In an effort to overcome its loss of market share amid a slower-growing overall market, Intel plans to launch its largest product refresh in years.
>
>"New products based on the Core microarchitecture for power and performance will be launched this summer and refresh the Intel product line in all segments," Otellini said.
>
>Three new chips, one for each of the Core market segments, will be part of the rollout: Woodcrest for servers in June, Conroe for desktops in July, and Merom for notebooks in August.

文脈的にはCMAを採用した製品を6〜8月に前倒しで投入するというのもリストラクチャリングの一環。

6月にはMarvellへXScaleを売却。
ttp://news.cnet.com/Intel-sells-off-communications-chip-unit/2100-1006_3-6088305.html

2006年第2四半期の、前四半期より更に低調な決算を発表した翌日(7/20)には役員人事。
ttp://pc.watch.impress.co.jp/docs/2006/0721/hot438.htm

111 :Socket774:2011/11/06(日) 00:49:17.48 ID:UAQkgGYY
世の中には最高益出したと同時に開発者を大量リストラしたスクエニって企業もあるのよ。

112 :Socket774:2011/11/06(日) 01:09:50.77 ID:CcEL+lwI
あそこは開発を自社で抱えたくないんでしょ

113 :Socket774:2011/11/06(日) 01:24:19.83 ID:H60KplLz
結局どこに事業ドメインをおくかでしょ。

AMDは半導体を外に出しちゃったしATIも一定の成果あげちゃったし
営業にいたってはIntelのパワーゲームに勝てるわけないし

理論設計だけでやってけるか謎だけど、Intel一社になったらx86はマイナー転落だろうな。

114 :Socket774:2011/11/06(日) 01:32:51.18 ID:ecJIB34Q
スクエニは確かクビ切ったのと同時に新入社員も大量に入れてるな
社長がイエスマン欲しいのか、若手7割にしたら問題解決とか言ってたし

AMDは厳しそうだな・・・ATI買収しといて良かったね
ってくらいか
単体ならまず死んでる

115 :Socket774:2011/11/06(日) 01:39:55.74 ID:gZZxRbNS
>>114
スクエニは組織を新しくしたいのか。
毛色の違う会社になるのかも。

116 :Socket774:2011/11/06(日) 03:25:15.07 ID:In7LY003
コンピュータの高性能化が終わったら科学技術の進歩はどうなるんだ?

117 :Socket774:2011/11/06(日) 05:15:28.01 ID:7JHbn030
AMDが終わっても、アーキテクチャ間の競争は終わらない。

118 :Socket774:2011/11/06(日) 10:20:21.92 ID:UeaW747B
AMDの存在はコンピュータの歴史全体から見ると
あってもなくてもたいしてかわらん程度の影響度でしかない。
ARMの方がはるかにでかいよね。

119 :Socket774:2011/11/06(日) 10:46:42.31 ID:uUPBubTs
>>118
結局はx86互換メーカーの1つでしかないから、AMD
ところで、未だに?オクでSUNのSparc機が出たりしてるが、買った人いる?
俺は、Blade150買ったけど、、たいして役にたってない。



120 :Socket774:2011/11/06(日) 10:53:48.88 ID:uUPBubTs
SpecCPU2000辺りだとUltaraSparc3の1.2GhzがPen4-2Ghzぐらいの性能だけど
実際のアプリでの性能差だとどうなんだろ?

121 :Socket774:2011/11/06(日) 11:01:11.44 ID:H60KplLz
コンピュータの歴史全体という視点からなら、AMDがないとIntelは成り立たなかった。

Intelは単なる半導体メモリの製造技術しかなく、一方AMDはCPU周辺回路設計技術があり、
AMDからの技術供与でIntelCPUが成り立った。 ともにフェアチャイルドからの独立組みな。


122 :Socket774:2011/11/06(日) 11:14:18.53 ID:uUPBubTs
SUNのSparcが登場したころは、x86は行き詰まり死滅するはずだったが、、
現に、性能では386/486より上で俺は「いつかはSUNやHPのUNIX機を買うぞ」
と思い、十数年、、いざ買ってみると「なんだ、この程度か。」と拍子抜け。
何か普通のPCとは違う世界を味わえるかと思ったが的ハズレだった。


123 :Socket774:2011/11/06(日) 11:49:04.48 ID:gZZxRbNS
うお、フェアチャイルドがもとだったのか!?
これは目から鱗。

124 :Socket774:2011/11/06(日) 12:22:51.16 ID:jXisSrix
486/Pentium時代は、IntelはRISC勢にぼろ負けしてた
ただしその後、Intelはチップ内部にRISC的な設計思想をかなり取り入れ、
従来のCISCの命令セットの互換を保ったままCPU内部をRISCとCISCのいいとこどりみたいなのに進化させて、
RISCの利点がなくなったけどな

125 :Socket774:2011/11/06(日) 12:38:25.88 ID:TNhtuW9t
>122
90年代ならAlphaあたりはx86と格の違いを見せ付けてたんだけどな

日本語で一番詳しいのはando さんのところか。他のサイトはもっと頑張らないと
 AMCCのARMv8プロセサX-Gene
 Calxedaのサーバ用4コアARM Cortex-A9チップ
 ttp://www.geocities.jp/andosprocinfo/wadai11/20111105.htm

どちらもモバイルとはインターフェイスのリッチさが違うしECC使えたりで
なんちゃってサバ仕様ではなく本気だなって印象

126 :Socket774:2011/11/06(日) 12:42:14.89 ID:gZZxRbNS
Andoさんは別格。

127 :Socket774:2011/11/06(日) 13:03:49.84 ID:NSXl9wKe
andoさんは確か富士通のSPARCアーキテクトで、仕事やめてからも、
大学で非常勤かなんかで講師やってるんじゃなかったっけ?

128 :Socket774:2011/11/06(日) 13:23:17.37 ID:gZZxRbNS
SPARCに絡んでたのは聞いてたが、アーキテクトだったのか。
すげぇw

129 :Socket774:2011/11/06(日) 16:17:20.23 ID:UeaW747B
>>121
なんでこういうデタラメを平気で書く人がAMD周辺からはあとを絶たないんだろうか。
Intelは自社のメモリを拡販するためにプロセッサを作ったのが事の始まり。
AMDはプロセッサは後発参入なんだが。

130 :Socket774:2011/11/06(日) 16:21:57.35 ID:JxM2qe8P
intelのセカンドソ−スでは

131 :Socket774:2011/11/06(日) 17:05:41.70 ID:u/JJbn9o
>>125
一つ上の記事が気になった。MIPS系だろうか。

132 :Socket774:2011/11/06(日) 17:42:20.30 ID:L8kSdmbW
>>129
だよな。AMDはx86の生産委託を受けたって企業ってイメージしか無いわ。

133 :Socket774:2011/11/06(日) 17:47:12.12 ID:gZZxRbNS
元DECのエンジニアが多いんだったっけ?

134 :Socket774:2011/11/06(日) 17:58:04.43 ID:u/JJbn9o
>>133
とりあえず今話題にしているAMDプロセッサの黎明期って意味では
DECのエンジニアは関係ない。AM2900の顧客がDECだったとかは関係あるかもしれないが。

135 :Socket774:2011/11/06(日) 17:59:46.43 ID:gZZxRbNS
ダーク・メイヤーが元DECだったのが印象深くてね。
黎明期はまだDEC色はなかったんだね。

136 :Socket774:2011/11/06(日) 18:02:07.67 ID:H60KplLz
>>129
なんでこういう無知を平気書く人がIntel周辺からは後を絶たないんだろうか。
「プロセッサ」「CPU」ってぇのを半導体で集積回路を起こした「マイクロプロセッサ」だけしか知らないからだろうなw

Intelがプロセッサを作ったのは日本のビジコン社から電卓用チップの製造委託を受けたのが事の始まり。
結局Intelだけでは設計できず、ビジコンから嶋さんが設計に入ってようやく完成したのがi4004。
電卓用ではなく汎用にしたらいいんじゃね?的な発想はIntel側から出たが、結局理論設計やったのは嶋さん。

i4004で味をしめたIntelはその後i8008開発したけど失敗、さらにi8080開発しようとしてテンでだめだったから
結局嶋さんをヘッドハントしてようやく完成にこぎつけた。

そもそもIntelが世界で始めて開発したのは「マイクロ」コンピュータであって、おもちゃに毛が生えたものでしかない。
当時は汎用機のCPUが中心で、コアメモリや磁気メモリ中心だったところに半導体メモリに目をつけたのがIntel。
一方のAMDは汎用機のCPUの周辺回路をマイクロチップ化することで事業をスタートした。

AMDは周辺回路のほかに不揮発性メモリの技術もあって、Intelはこれらの技術もライセンス供与を受けている。

137 :Socket774:2011/11/06(日) 18:05:14.84 ID:gZZxRbNS
>>136
日本人すげーw

138 :Socket774:2011/11/06(日) 18:12:26.70 ID:gZZxRbNS
嶋正利
http://ja.wikipedia.org/wiki/%E5%B6%8B%E6%AD%A3%E5%88%A9

こんなすごい人がいたなんて知らなかった!
CPUなんてものは最初から欧米の人間が設計の中心だと思ってた。

>嶋は「欧米の人たちと比べても、自分が劣るなどと決して思ったことはありません。
>機会さえあれば日本人も創造的開発はできます」[7]と述べている。

勇気付けられるね。


139 :Socket774:2011/11/06(日) 18:16:40.94 ID:7JHbn030
×日本人がすごい
○嶋さんがすごい

あと池田敏雄とか
エンジニアリングに国境はない

140 :Socket774:2011/11/06(日) 18:38:05.20 ID:H60KplLz
いやいやいや、日本人も結構スゴイんですよ?

半導体も真空管もリレーも使わずにフェライトコアだけで論理回路を構成するパラメトロンとか日本人の発明ですぜ。
パラメトロン計算機とか上野の博物館で隅に追いやられて忘れ去られてるけど…。


141 :Socket774:2011/11/06(日) 18:54:34.80 ID:UeaW747B
>>136
このスレならそれくらい常識。
ネットで検索して多少はまともなレスができたようだが、
Intel的にはビジコンの件もDRAMを売りたいからむしろマイクロプロセッサがメモリの周辺ICの感覚だったのよ。
で、AMDがなければIntelがなかったという論拠はなんなんだろうか?
セカンドソースって米国と日本のメーカーを含めて何社もあった中のAMDは一つにしかすぎんのだが。

142 :Socket774:2011/11/06(日) 18:58:30.49 ID:UeaW747B
ちなみにIntelの創業者のノイスは世界初の集積回路の発明者で、
マイクロプロセッサ、SRAM、DRAMの発明はTIと並んでIntelが最初。
4004は嶋さん自身も言っているとおり、メインフレームのアーキテクチャの影響は受けてない。

143 :Socket774:2011/11/06(日) 19:34:50.14 ID:UUUJ6fve
>>139
俺が最初に嶋正利について知ったとき感じたのはこの人のすごさよりも
日本企業のビジネス感覚、人材活用ののしょぼさ、間抜けっぷりへの失望だった。

144 :Socket774:2011/11/06(日) 21:59:51.68 ID:H60KplLz
>>141
> Intel的にはビジコンの件もDRAMを売りたい
i4002はDRAMではない。嘘の上塗り恥ずかしいよ。

145 :Socket774:2011/11/06(日) 22:01:03.61 ID:H60KplLz
>>142
で、どこのだれがi4004がメインフレームのアーキテクチャだなどと主張を?

146 :Socket774:2011/11/06(日) 22:03:08.08 ID:xLjXsWBB
>>144
横から失礼
それはおまえの認識不足か読み違ってるだけ

147 :Socket774:2011/11/06(日) 22:04:07.66 ID:c5UKFg5N
AMDの設立って1969年でセカンドソースはじめたのってi8088の1979年くらいからだろ
製品がでる10年も前からセカンドソースの一つってどんだけオーパーツ?

148 :えるえる:2011/11/06(日) 22:21:19.61 ID:UeaW747B
4002
The RAM chip stored four 80-b numbers and additionally the chip had an output port.
The use of three-transistor dynamic memory cells made the RAM chip feasible.

three-transistor dynamic memory cells
誰とはいわないけど。嘘の上塗りってほんとに恥ずかしいですね。わらい。

149 :Socket774:2011/11/06(日) 22:24:24.08 ID:H60KplLz
>>147
セカンドソースはi8085からなのと、i8080のデッドコピーをAMDも作っているから、
その意味ではAMDは1975年くらいから互換プロセッサメーカだった。
ただその当時からAMDはオリジナルCPUだしてるけどね。

で。
i8080はおろかi8085にいたるまでIntelはDRAMコントローラを出すことができなかったし、
i8085に至ってはメモリを接続するのにアドレスとバスを分離するのに自社外のバスコントローラを必要とした。
半導体メモリの拡販のためのプロセッサ開発なんていうのは相当苦しい後付の理由だね。
事実だとしても、Intelは自力じゃ自社のマイクロプロセッサに自社のメモリをつけることができないという
間抜けっぷりをさらしたことになる。

AMD(というかその他の半導体メーカ)はマイクロプロセッサ開発においてはIntelに水を開けられていたのは事実。
嶋さんがZilogに移ってZ80出したおかげでひっくり返されて、IBMが8088/80286採用するまで沈んでたけど。

AMDはバスコントローラやFPU、時代が下ってからは不揮発性メモリなどの技術を押さえ、
この部分でIntelに対しライセンス供与を行っている。

150 :Socket774:2011/11/06(日) 22:25:23.29 ID:H60KplLz
>>148
あら失礼。

151 :えるえる:2011/11/06(日) 22:26:11.87 ID:UeaW747B
4004はテッドホフ=アーキ担当、嶋=実装担当
みたいなイメージなのかな。

もともとコンピュータ史に興味があれば、
IBM > CRAY, Intel, DEC, UNIVAC > Sun, Motorola > AMD
としか思わないはずなので、
ネット見ながら応戦しているのがばればれである。

152 :Socket774:2011/11/06(日) 22:28:43.25 ID:UnBk6tkg
つうか70年代当時に販売担当上級副社長だったエド・ゲルバッハが「我々は
マイクロプロセッサをメモリ製品の拡販の手段と考えていた」と語っているんで、
そこら辺は常識の範囲だろ。

153 :えるえる:2011/11/06(日) 22:29:48.49 ID:UeaW747B
>>149
そんなに堅く考える必要性ないだろ。
今みたいにIntelに自社の支配力がない時代には、他社と補完路線で商売やってたってだけのような。
セカンドソースは自社で製品安定供給できる製造体制ととのえば、利益ないからやめたくなるんじゃないの?

154 :Socket774:2011/11/06(日) 22:29:52.81 ID:H60KplLz
>>151
> 4004はテッドホフ=アーキ担当、嶋=実装担当
それはさすがに嶋さん怒るな。

> ネット見ながら応戦しているのがばればれである。
というレッテル貼りしたいのがミエミエなわけだけが、
コンセプトメーカしか並べられず半導体メーカを出せていないあたりでニワカってレッテル貼りかえせばいいのかな ;-)

155 :Socket774:2011/11/06(日) 22:34:29.76 ID:H60KplLz
>>153
実際その状況になったのは i80286が安定してからだよね。

Intelはセカンドソーサを何度かつぶしにかかってるけど、AMDはそのたびにしぶとく生き残ってる。
背景の一つにクロスライセンスがあるわけだけど、前に更新したのが2001年だからそろそろ切れるのかもね。


156 :Socket774:2011/11/07(月) 00:47:53.34 ID:598dwazn
携帯電話が地球シミュレータと同等の演算能力を持つというのか。
ARM恐るべし

157 :Socket774:2011/11/07(月) 04:17:23.77 ID:L773e4Yw
Core 2 Duo はキビキビしすぎて少しでもプログラムが
遅れてタイミングがズレるとにエラーになる事が多い。
WMPみたいに、しぶといプログラムはエラーにならず、
開始するのに時間がかかる。P4の、もっさりの方が快適
なんだが、熱に弱いのがネック。

158 :Socket774:2011/11/07(月) 04:58:20.16 ID:+h1mwsvo
えるえるって前にトンデモ理論振りかざして
ボコボコにされてたやつじゃねえか・・・

159 :Socket774:2011/11/07(月) 07:59:19.61 ID:4hSB2nzz
まあ言ってることは間違ってはいない

160 :Socket774:2011/11/07(月) 09:29:25.35 ID:tIhiyhKc
>>153
×Intelに自社の支配力がない時代
○Intelに自社の開発力がない時代
そう言えばMotoは自社で6800の周辺チップ一通り揃えてたけど
性能や価格面ではダメダメだったのを思い出した

161 :Socket774:2011/11/07(月) 11:15:11.29 ID:vqJLMGpp
リファレンスを提示するとかが主で、性能や価格を頑張らない
ものってのが昔はあった気がする。
どこもかしこも世知辛い今はもうなさそうだが。
モトローラが該当するかどうかは知らない

162 :Socket774:2011/11/07(月) 16:14:07.75 ID:uNNC+L/4
富士通、最大23.2PFLOPSを実現するスパコンを発売〜京で用いた技術をさらに発展
http://pc.watch.impress.co.jp/docs/news/20111107_489081.html

40nmで16コアで1.848GHzで110W

163 :Socket774:2011/11/07(月) 17:41:17.11 ID:vqJLMGpp
IXfx のダイサイズはかなり大きい

IIIVfx 45nm 8Core 513mm2
http://journal.mycom.co.jp/photo/articles/2011/09/05/kei_supercomputer/images/003l.jpg

IXfx 40nm 16Core
http://pc.watch.impress.co.jp/img/pcw/docs/489/081/html/04.jpg.html

164 :Socket774:2011/11/07(月) 18:00:54.19 ID:mETZ5tg9
消費電力倍かよ。
フル構成時のシステム消費電力凄い
事になりそうだな。


165 :Socket774:2011/11/07(月) 18:11:35.63 ID:vqJLMGpp
同じ1PFLOPSのシステム同士で比べたら
VIIIfxからIXfxでノード数が半分近くに減るから
インターコネクトチップやらなんやらの分だけ電力は減るだろう

IXfxのダイサイズがかなり恐ろしいことになってそうなのが気になる。
Tukwila も超えて最大級なんじゃないのかな

POEWR7 567mm2
POWER6 341mm2
SPARC64 VIIIfx 513mm2
SPARC64 VII 445mm2
Tukwila 699mm2
Montecito 596mm2
Westmere-EX 513mm2
Nehalem-EX 684mm2
Magny-Cours 346mm2x2 MCM
GTX580 520mm2
Radeon HD6970 389mm2

166 :Socket774:2011/11/07(月) 18:49:14.06 ID:mHeWIMwy
コピペ情報

SPARC64 IXfx
TMSC 40nm
ダイサイズ 21.9 mm × 22.1 mm
トランジスタ数 約 18 億 7000 万個

SPARC64 VIIIfx
富士通45nm
ダイサイズ 22.7 mm × 22.6 mm
トランジスタ数 約 7 億 6000 万個

167 :Socket774:2011/11/07(月) 19:10:05.65 ID:bCCRVu4f
富士通先端プロセスェ……

168 :Socket774:2011/11/07(月) 19:45:33.28 ID:gMmqsDRj
>>154
フェデリコ・ファジンを忘れてもらっては困るでござるよ。彼も嶋さんとザイログ行っちゃったけどね。
ピーナッツでIBMが出した2ndソース要求が元々だけど、MILスペックを取ってたのはAMDだけだったからアタマ一つ飛び抜けてた。

169 :Socket774:2011/11/07(月) 21:26:10.62 ID:fmSbxnKO
ここで IBM fab club について一言↓

170 :Socket774:2011/11/07(月) 23:12:17.05 ID:UlJ7ISjD
>>158
そんなことあったか?

171 :Socket774:2011/11/07(月) 23:32:04.50 ID:mHeWIMwy
妄想垂れ流してた漢字コテハンのやつが使ってた
もう一つの名前がえるえるだとおもってたけど違うのか

172 :Socket774:2011/11/07(月) 23:35:44.59 ID:UlJ7ISjD
このあたりかな。1年前の。結構いまみると他のレスよりまともだと思うが。
http://www.varusu.com/thread/jisaku/1274809074/

173 :Socket774:2011/11/08(火) 00:03:29.63 ID:whGG3rJt
日本発のCPUアーキテクチャを開発してほしい。
ARMに対抗するようなヤツ。

174 :Socket774:2011/11/08(火) 00:05:11.31 ID:NQmcsU5G
あるだろw SHとか。

175 :Socket774:2011/11/08(火) 00:54:43.81 ID:siJmdRDd
M2090(GF110) 40nm 520mm 177GB/s 6GB TDP225W
 LINPACK 346? GFLOPS/理論値 665GFLOPS = 0.52?
SPARC64 IXfx 40nm 484mm 85GB/s 64GB 110W
 LINPACK 220? GFLOPS/理論値 236.5GFLOPS = 0.93?

GPUもTufuみたいなインターコネクトでつなげば実効効率あがるのかな。
しかしそうするとコスト差が小さくなるはず

176 :Socket774:2011/11/08(火) 00:56:14.51 ID:+6Q8QlOQ
震災でルネサスから出荷とまって自動車産業に大打撃与えたのってSHだっけ?

177 :Socket774:2011/11/08(火) 02:25:10.88 ID:xQnlrl77
>>164
ワットパフォーマンスは上がるだろ
だから実質的に消費電力が減る

178 :Socket774:2011/11/08(火) 02:38:01.96 ID:4J5KFli2
TSMCのプロセスでも1.8GHzぐらいなら出せるんだ

179 :Socket774:2011/11/08(火) 03:14:21.38 ID:4AFzjJ75
>>178
TSMCと富士通でどっちがクロック出しやすいかはしらないが、
TSMCは40nmで倍のコア数(トランジスタは2倍弱?)の模様。

180 :179:2011/11/08(火) 03:15:38.40 ID:4AFzjJ75
上の方に書いてあったか。二倍強だ。
28nm移行も、みたいに書いてあったけど28nmはみんなが
TSMCに委託するからバックオーダー抱えまくりじゃん。

181 :Socket774:2011/11/08(火) 06:26:18.59 ID:JWtVALlg
SPARC64はハイエンド側に追いやられてどんづまりだと思っていたが、
まさかHPCで生きのこるとは。

182 :Socket774:2011/11/08(火) 06:37:19.82 ID:siJmdRDd
IXfx は特化CPU、T4も特化CPU、もし両方生き残れれば
汎用ではないことが生き残りの理由ってことになるのかな

183 :Socket774:2011/11/08(火) 07:14:54.67 ID:JWtVALlg
メインストリームから外れた以上、ニッチに特化するのは必要条件、
って当たり前すぎて面白くないけど。
全ては(チップアーキテクチャの優劣とは無関係に)強力なユーザーを捕まえられるかどうか、
そのユーザーが生き残れるかどうか、にかかっていると思う。AlphaはDECとともに倒れた。
RISCのもう一つの雄、ハイエンドには行けなかったMIPSはどうなるかな。

184 :Socket774:2011/11/08(火) 09:46:57.26 ID:MhLpVB9N
Bladeワークステーションを買って、Solaris使えばスパコン気分が味わえるはず。


185 :Socket774:2011/11/08(火) 10:13:35.78 ID:JWtVALlg
豆腐もつけないと……

186 :Socket774:2011/11/08(火) 12:57:09.18 ID:MhLpVB9N
>>181
元からハイエンド向けに作られたのがSparc64じゃないの?
端から、PCや携帯なんて考慮してない。


187 :Socket774:2011/11/08(火) 13:16:02.11 ID:cCvfqTaO
そういやItaniumってまだ息してたっけ?

188 :Socket774:2011/11/08(火) 13:22:39.10 ID:rD8+vPdx
来年、32nmのが出るので、まだ息はしている。
hpが採用している限り、やめられないだけな気もするけど。

189 :Socket774:2011/11/08(火) 14:24:09.71 ID:DRZy98ol
>>183
中国のスマートフォンやHPCはMIPSベースだべ

190 :Socket774:2011/11/08(火) 15:21:10.07 ID:czzaVWbf
MACオタが消えると本当に誰も口上に載せないな>POWER

191 :Socket774:2011/11/08(火) 16:09:58.18 ID:065VaUjw
http://news.mynavi.jp/news/2011/11/08/020/index.html

なお、同社ではGPUコンピューティングやIntelのMICアーキ
テクチャなどについても、

「IntelのKnightシリーズは8SIMD、GPGPUは16SIMDだと思っており、
単に演算器を増やすほうがコアを増やすよりも確かに増やす
トランジスタ数の問題では楽になる。
しかし、もう1つの問題として、超並列演算を低消費電力で
実現するためにはインタコネクトをCPUに内蔵する必要がある。
我々はTofuで、その第一歩を築けた。
我々のほか、こうしたアプローチが現在出来ているのは
IBMがBlue Geneで実現しているだけであることを考えれば、
我々が一番Exaスケールの実現に近いと思っている」

と、2018-2020年ころが目標とされているExaスケールを20MW
程度で実現するのに、最も近いのは富士通であることを強調した。

192 :Socket774:2011/11/08(火) 16:47:48.56 ID:ByYh8jJ6
富士通研、CPUの廃熱を用いた冷却用冷水製造技術を開発
http://news.mynavi.jp/news/2011/11/08/021/index.html

富士通ノリノリですね

193 :Socket774:2011/11/08(火) 17:49:53.61 ID:08YawsXY
理研の建物が既にそうなんじゃないのかという気がする(プレスリリース日がFXと同じだし)んだけど、実際はどうなんだろう。

194 :Socket774:2011/11/08(火) 19:14:09.33 ID:whGG3rJt
富士通すげぇな。

195 :Socket774:2011/11/08(火) 20:08:38.70 ID:9JctjHde
富士通はいいから早くJapanistの製品版と64bitドライバをリリースしろ

196 :Socket774:2011/11/08(火) 23:26:19.31 ID:czzaVWbf
関係ないけど,大学時代富士通のスパコンでOAKが使えたのには笑った。

197 :Socket774:2011/11/09(水) 00:05:01.16 ID:7cxnclMt
本当に全く関係ないな。

198 :Socket774:2011/11/09(水) 01:02:11.88 ID:gwae3QrI
>>178
SPARC T4 は 3GHz だよ

199 :Socket774:2011/11/09(水) 10:13:37.93 ID:kkv8OM+F
シンプル・低クロック・ローパワー・メニーコアだったNiagaraが
どんどん普通のパフォーマンスコアに近づいていく一方で
またARMで同じ歴史をもう一回繰り返そうとしている件

200 :Socket774:2011/11/09(水) 13:38:46.51 ID:S7d2/MTH
つまりARMがハイパフォーマンス指向で行き詰まった後RXマイコンの時代が来るというわけだな。

201 :Socket774:2011/11/09(水) 14:00:38.48 ID:kkv8OM+F
RXのARMに対する優位性がよくわからない。
ルネサスの全面サポートがあるからマイコンにはいいんだろうけど、
それはD/Aコンバータ買ったらおまけで付いてきたコアがたまたまRXだった、みたいな話で、
別におまけはARMでも構わないだろう、と。

202 :Socket774:2011/11/09(水) 15:38:17.66 ID:kVU5uXh9
Niagaraの失敗を見てもAMDは何も学ばなかったようだな。

203 :Socket774:2011/11/09(水) 18:49:14.26 ID:Vban78Wt
>>196
大型コンピューター用のOAKはJEFっていうんだぜ。

204 :Socket774:2011/11/10(木) 09:43:36.82 ID:GMIxkngh
Niagaraは失敗じゃないyo!

205 :Socket774:2011/11/10(木) 18:44:32.62 ID:Kfh1/tzs
http://livedoor.blogimg.jp/netamichelin/imgs/3/8/38c2405b.jpg

206 :Socket774:2011/11/10(木) 21:28:10.30 ID:vtMmLWuT
糞なコアをたくさん積んでも糞は糞でしかない。

207 :Socket774:2011/11/10(木) 22:30:50.00 ID:SUJUpFk+
>>205
流石のビッグブルー。

208 :,,・´∀`・,,)っ-○○○:2011/11/11(金) 01:51:27.39 ID:lEV7BMte
>>201
ARMはでかすぎるだろwww
携帯電話にPentium 4を載せようって言ってるようなもの。

RXはM16Cの系譜で十分な実績がある。ボタン電池で動くような機器にも使われてるぜ。
とはいっても三菱を中心とした国内家電メーカーのガラパゴスプラットフォームが主戦場なんだけどね。

209 :Socket774:2011/11/11(金) 11:00:05.55 ID:y5bnUGEx
ARMv8でレジスタ倍増して、コンディションビットが削られて、
なんか普通のRISCになってきた件
実はMIPSで良くね?

210 :,,・´∀`・,,)っ-○○○:2011/11/11(金) 21:03:47.91 ID:lEV7BMte
MIPSってARMが台頭してから斜陽って印象あるけどいまだに時価総額ではIntelの倍もあるんだよな。

211 :Socket774:2011/11/11(金) 21:39:52.54 ID:BQdc+Z2g
んな馬鹿な

212 :,,・´∀`・,,)っ-○○○:2011/11/11(金) 22:02:16.40 ID:lEV7BMte
http://finance.yahoo.com/q?s=MIPS
Market Cap: 273.30M

http://finance.yahoo.com/q?s=INTC
Market Cap: 122.51B


MとB読み間違えてた

213 :Socket774:2011/11/11(金) 22:07:37.99 ID:ZsiHYzJb
だんごも人間だなw

214 :Socket774:2011/11/11(金) 22:11:38.97 ID:UARXw3tP
えっ

215 :Socket774:2011/11/11(金) 23:11:31.66 ID:/rubVh8/
lol

216 :Socket774:2011/11/11(金) 23:38:51.01 ID:sbpA7QMM
http://news.mynavi.jp/articles/2011/10/31/arm8/001.html
> オペコードは32bitで、レジスタ指定ビットは5bitとなる。命令によってはこれに32bitまたは64bitのオペランドが続く。
32/64/96bit可変長? 相変わらずRISCらしくない。Thumb-2もそうだけど。


217 :Socket774:2011/11/11(金) 23:52:37.78 ID:FN/1HnC6
>>75の資料にはそんなこは書かれていない
ライターの勘違いだろ

218 :,,・´∀`・,,)っ-○○○:2011/11/11(金) 23:54:36.10 ID:lEV7BMte
x86フォーマットの利点を部分的に取り入れた形だね。
従来のARMのようなリテラルプールからのロードはコストが大きい。
命令フェッチと同時に即値が得られるメリットは大きい。

219 :,,・´∀`・,,)っ-○○○:2011/11/11(金) 23:55:17.93 ID:lEV7BMte
>>217
まあ単なるリテラルプールかもしれないね

220 :Socket774:2011/11/12(土) 00:07:47.27 ID:IvUr1heL
A64はThumbなしでx86のオブジェクトコードサイズに対抗出来るのか?

221 :Socket774:2011/11/12(土) 00:44:55.20 ID:yYVXMI0w
レジスタフィールドに各5bit使っちゃうとさすがに16bit化はできなそうだよな

222 :Socket774:2011/11/12(土) 01:06:38.48 ID:8gOK4EVR
ThumbもコンディションビットもARMの差別化要因だったのに、
それを捨てての32レジスタ化はやや疑問


223 :,,・´∀`・,,)っ-○○○:2011/11/12(土) 01:29:11.61 ID:rlP+RKEI
汎用レジスタは31本じゃね?
32本目はゼロレジスタなのか、あるいは特別な意味(たとえば11111=即値参照)を持つのか
どっちやろね?

224 :Socket774:2011/11/12(土) 02:19:52.00 ID:U45BaRXO
ゼロレジスタはあるようだが32本目として実装されてるのかは分からんな。

225 :Socket774:2011/11/12(土) 02:54:07.90 ID:yYVXMI0w
知らなかったがNECのV800シリーズはリテラルがあるときだけ32bitで通常命令は16bitだったのな
http://www.cqpub.co.jp/dwm/column/mpi/dwm0038mpi7.htm

226 :Socket774:2011/11/12(土) 11:24:50.41 ID:IvUr1heL
31か32かは問題ではない

227 :,,・´∀`・,,)っ-○○○:2011/11/12(土) 11:53:51.03 ID:rlP+RKEI
問題あるよ。11111Bがレジスタではない別のオペランドを表現できる可能性があるからね。

228 :Socket774:2011/11/12(土) 12:03:31.81 ID:8gOK4EVR
いやそれもちょっとは問題だけど、レジスタ指定が4bitか5bitかに比べれば些細な問題だろう

229 :,,・´∀`・,,)っ-○○○:2011/11/12(土) 12:10:35.57 ID:0Rl4D2Is
Knights*のSIMDは5ビットになるけどね

230 :Socket774:2011/11/12(土) 17:29:41.07 ID:tY9Kax8N
IEE754形式の単精度型で表現できる数の最大の正の数
正規化された数で最小の正の数、最小の正の数がわかりません
おしえてくださいmm

231 :Socket774:2011/11/12(土) 17:56:13.02 ID:BqqThEFE
逆にベクトル演算は32本じゃ足りないのでは?

232 :,,・´∀`・,,)っ-○○○:2011/11/12(土) 18:28:59.08 ID:9Qg5HDCp
16x16単精度の行列積でギリギリ足りる程度。

233 :Socket774:2011/11/12(土) 22:17:49.39 ID:8gOK4EVR
512bit*32本ってSPEの128bit*128本と同じサイズなのか。

234 :,,・´∀`・,,)っ-○○○:2011/11/12(土) 22:26:53.12 ID:9Qg5HDCp
更に4つのスレッドごとにあるから4倍だね。
SIMDレジスタだけで1コアあたり8KB。
冷静に考えると凄い量だよな。

235 :Socket774:2011/11/12(土) 23:06:16.05 ID:8gOK4EVR
多い分だけL1キャッシュ並のレイテンシなんじゃないの?

236 :Socket774:2011/11/13(日) 00:03:21.42 ID:jL9bcfGb
IPFは未だにL1$のレーテンシが1だが

237 :Socket774:2011/11/13(日) 00:13:00.04 ID:014AhMR2
クロックいくつの話だろう

238 :,,・´∀`・,,)っ-○○○:2011/11/13(日) 01:16:19.61 ID:T27q85rv
>>235
L1キャッシュのアクセスはタグ引きがあるから番号と物理位置がすぐに求まるレジスタファイルには勝てない。
レジスタリネーミングとかやりだすとまた話は別だけどね。

239 :,,・´∀`・,,)っ-○○○:2011/11/13(日) 01:22:12.27 ID:T27q85rv
GPUでは数十KBあるけどやはりレイテンシは大きいらしいね。
使いやすくするために次世代Teslaではレジスタファイルの階層化やるって話だから
キャッシュとあんまり変わらなくなるかも。

240 :Socket774:2011/11/13(日) 01:36:08.54 ID:AFjtl6VE
Knights Cornerを安価にばらまいてくれたら
いろいろやってみる機会ができて面白いだろうになあ
一般向けでバーゲン価格はありえないかもしれないけど

241 :Socket774:2011/11/13(日) 02:00:17.52 ID:Utilcmxj
>>239
>GPUでは数十KBあるけどやはりレイテンシは大きいらしいね。
シェアードメモリのことかな?
やっぱいくつかで共有するとアービトレーションでレイテンシかかるのかな。

242 :,,・´∀`・,,)っ-○○○:2011/11/13(日) 02:31:37.97 ID:T27q85rv
いや、レジスタファイルそのものがでかい。
単精度×32768本って何バイト?

243 :Socket774:2011/11/13(日) 03:13:38.55 ID:Utilcmxj
えっ、レジスタなのにレイテンシ大きいの?
最悪じゃん。

244 :Socket774:2011/11/13(日) 03:44:13.48 ID:DOg34JEF
それを隠蔽するのがGPUの真骨頂だからなぁ >レイテンシを最適化するCPUとスループットを最適化するGPU

数百クロックのメモリレイテンシを隠蔽するために長大なパイプラインと膨大なレジスタが必要になるわけで。
そして膨大なレジスタの搭載でレイテンシが長くてもパイプラインである程度は隠蔽できるしね。
フルHDなら常に200万スレッドが並走しているからレイテンシよりも容量を取ってもおかしくない。

245 :Socket774:2011/11/13(日) 07:11:40.39 ID:LN6eg/Tp
GPUは、レジスタへのアクセス(とシェアードメモリ)はレイテンシがマルチスレッドで完全に隠蔽できて、実質1クロック

246 :Socket774:2011/11/13(日) 22:38:45.60 ID:lCs86oaR
>>244
200万スレッドw
1pixel1スレッドw
どんだけ無駄な設計だよw

247 :,,・´∀`・,,)っ-○○○:2011/11/13(日) 22:42:46.62 ID:T27q85rv
512SPで8192スレッドくらいだったような。

248 :Socket774:2011/11/13(日) 22:44:39.56 ID:y3Ce4y6z
>>246
シェーダープログラム書いてみ? 1ピクセル1スレッドだから。

249 :,,・´∀`・,,)っ-○○○:2011/11/13(日) 22:48:12.02 ID:T27q85rv
同時処理するわけじゃないからね。

250 :Socket774:2011/11/13(日) 22:48:32.89 ID:014AhMR2
物事は様々な抽象レベルで考えるんだ

251 :Socket774:2011/11/13(日) 23:12:55.54 ID:lCs86oaR
>>248
GPUってデバッガで実行過程をトレースすることもできないのに
シェーダのソースコードだけから物理的な動作を推測するのは無理があるわw

252 :Socket774:2011/11/13(日) 23:45:12.33 ID:LN6eg/Tp
Parallel Nsight使え

253 :Socket774:2011/11/13(日) 23:52:49.81 ID:Utilcmxj
なるほど。
GPUはレイテンシをうまく隠蔽してるんだね。

254 :Socket774:2011/11/14(月) 00:26:23.84 ID:ak2saiFA
CPU ヨボヨボで1つのことしかこなせない老人
GPU いろんな人から多くの仕事を任せられる若者

って感じか

255 :Socket774:2011/11/14(月) 00:33:54.70 ID:FGGcGxSM
CPU 少数だけど頭が柔らかい人
GPU いっぱいいるけど頭が硬い人

こんな感じだろ

256 :Socket774:2011/11/14(月) 00:36:44.30 ID:Bvkz2l47
CPU … 数個の複雑な仕事をこなせる職人
GPU … 数千単位の単純な仕事をこなす工場

ってカンジだと。
生産性では大量生産な工場に敵わないが、
オーダーメイドでいろいろな仕事を熟せるCPUさん。

257 :Socket774:2011/11/14(月) 00:40:02.34 ID:+CNvzy9s
CPUは老練な感じがするね。

258 :,,・´∀`・,,)っ-○○○:2011/11/14(月) 00:57:34.26 ID:JD7xK2Zg
何か指示をしたら全員同じ動きをする人々

259 :Socket774:2011/11/14(月) 01:03:05.37 ID:+CNvzy9s
日本人みたいだな。

260 :Socket774:2011/11/14(月) 02:38:22.79 ID:/X0n8WLm
>>238
タグ引きはL1では並列に行うからレイテンシは増やさないよ
レジスタファイルはポート数大きいしレイテンシで特に有利ということはない

レジスタの見かけのレイテンシが小さく見えるのは
実行ユニット間でのフォワーディングがあるからだよ

>>239
NVIDIAがレジスタキャッシュを導入するのは消費電力を減らすのが主な目的らしい
CPUもレジスタキャッシュを持ったものはあるけど
これはポート数を増やすのがしんどいから見かけのポート数を増やすのが目的

AMDのVLIWはフォワーディングでレジスタのレイテンシを隠蔽している

>>248
GPUで言うところのスレッドは複数スレッドでPCを共有しているから
CPUのスレッドとは数え方が違う
言うまでもないかもしれないが

261 :Socket774:2011/11/14(月) 16:38:51.48 ID:cQRpyNQk
D.E Shaw研究所はAntonと呼ぶ分子動力学(Molecular Dynamics:MD)計算専用のスパコンを開発し、その最初のシステムでのシミュレーション結果を発表した。

タンパク質のフォールディングではミリ秒程度のシミュレーションを
行わないとどのように折りたたまれて行くかが分からないのであるが、
汎用スパコンでのシミュレーションでは1日掛かって100ns程度に
相当するシミュレーションしか出来ず、msのシミュレーションには
何万日も掛かってしまうので、実用的ではない。
これを専用アーキテクチャで100倍程度加速すれば、実行可能な範囲に
入るというのがAnton開発の狙いである。

D.E.Shaw氏が創立したD.E.Shaw & Coは運用資産2.5兆円の
世界最大規模のヘッジファンドであるが、現在は、Shaw氏は
ヘッジファンドの日常のマネジメントには携わらず、
D.E.Shaw Researchのチーフサイエンティストとして、
MDのアルゴリズムやAntonシステムの開発を行っているという。
そして、同研究所の運用費用はShaw氏のポケットマネーで賄われていると
言われている。

このAntonの512ノードシステムの最初の2台が完成し、それを用いて、
2万3,558原子のDHFR(5DFR)では10.4μs/day、11万6,650原子の
T7Lig(1AOI)では3.06μs/dayの性能を達成した。
http://news.mynavi.jp/articles/2009/12/01/sc09_gordonbell/001.html

262 :,,・´∀`・,,)っ-○○○:2011/11/14(月) 17:38:53.58 ID:JD7xK2Zg
>>260
論理レジスタと物理レジスタのマッピングが一致してる場合においてはレジスタ番号から
レジスタファイル上の位置の算出は低コストでできるでしょ。

キャッシュはヒットを確認してからはじめて転送できるので、確実にデータの存在が保証される
レジスタと同等のレイテンシってことはないはず(あくまで同等の容量と仮定した場合の話)

263 :Socket774:2011/11/14(月) 23:41:47.15 ID:MWtnjh65
バフェット氏のバークシャー、IBM株を107億ドルで購入−CNBC
http://www.bloomberg.co.jp/apps/news?pid=90920013&sid=aZZ5tMhrWX1Q

264 :Socket774:2011/11/15(火) 01:13:02.64 ID:RPSb6iGS
>>262
レジスタファイルはアドレッシングは簡単でもポート数が多いのでレイテンシが大きくなるという話だよ

265 :,,・´∀`・,,)っ-○○○:2011/11/15(火) 01:22:09.78 ID:Cr2GvgSQ
それはL1のRead/Writeポート数を増やしても同じことだ

266 :Socket774:2011/11/15(火) 01:28:39.77 ID:P4uo+OFN
まぁ、DRAMのレイテンシに比べたらかわいいもんだ。

267 :Socket774:2011/11/15(火) 08:40:11.45 ID:alKNyBpn
日本の家電メーカーはこぞってARMに向かっているのだね。

東芝「レグザ」,パナソニック「ビエラ」など,最新テレビの映像エンジンを支えるARMのCPUコア
http://www.4gamer.net/games/143/G014356/20111114064/

268 :Socket774:2011/11/15(火) 08:54:47.31 ID:CtWv9QlY
>>265
L1はせいぜい2ポートとかだけど
レジスタファイルはSNBのPRFなら多分7ポートとかそれくらい

そもそもレジスタファイルのレイテンシはほとんどの場合隠蔽される

269 :Socket774:2011/11/15(火) 09:00:12.30 ID:alKNyBpn
ついでに、ARM Technical Symposia 2011 Japanの他の記事
http://www.4gamer.net/games/032/G003263/20111111036/
http://www.4gamer.net/games/143/G014356/20111114046/
http://www.4gamer.net/games/137/G013737/20111110002/

270 :Socket774:2011/11/15(火) 23:19:14.66 ID:dOqUwe6R
このスレはKnights Cornerの話が
あまり出てきてなさそうだね


将来、京を負かすかもしれないぞ?


271 :Socket774:2011/11/15(火) 23:33:03.32 ID:M+XUj+BO
じゃあ、お前がネタ振りすればいいだろ
最近なんかトピックあったっけ?

272 :Socket774:2011/11/16(水) 01:40:17.71 ID:dgvdiitO
こないだIntelが複数のペタ級スパコンに採用されたよ!!って発表して以来特になんもない

273 :,,・´∀`・,,)っ-○○○:2011/11/16(水) 03:04:06.02 ID:iPcYYMFW
機密保持契約破ってまで話したがるベンダーもユーザーもいないでしょ。

274 :Socket774:2011/11/16(水) 03:16:41.93 ID:VoaI1vrk
米国国策事業に組み込まれたからどうでもええわ

275 :,,・´∀`・,,)っ-○○○:2011/11/16(水) 03:25:02.22 ID:iPcYYMFW
東大の次期スパコン、中国の大手IT企業浪潮と提携とか、おまいらがスルーしてただけで、
今年の7月以降大きな話題だらけだったしな。
あとは次のIDFあたりを待つくらいか。

276 :Socket774:2011/11/16(水) 03:27:33.27 ID:qvMADfQv
個人向けに売ってくれることを祈るだけw

277 :Socket774:2011/11/16(水) 03:39:29.08 ID:tLFbwzqP
>「Intel Federalは世界最高のスパコンを作り上げることを目的として
>米国政府と協力して立ち上げた」と米国政府との緊密性をアピール

278 :Socket774:2011/11/16(水) 04:32:36.71 ID:7nRxkD9l
大学研究機関が主要顧客なんだし
Knightsはもっと情報出してもいいとおもうんだけどな

279 :Socket774:2011/11/16(水) 04:53:51.39 ID:dgvdiitO
こないだCERNが出した発表でも使ったのKnightsFerryだったしパートナーのとこにもまだCornerは届いてないとか?

280 :,,・´∀`・,,)っ-○○○:2011/11/16(水) 07:27:06.84 ID:iPcYYMFW
現状、Larrabee 1の倍精度強化版である以上の何かだとは思ってないんだけどな。

281 :Socket774:2011/11/16(水) 07:50:46.96 ID:a0ElPuLG
【スパコン世界一「京」の全貌】
「世界最速」を実現したアーキテクチャ
http://itpro.nikkeibp.co.jp/article/COLUMN/20111104/372504/
新機能満載のCPUとTofuインターコネクト
http://itpro.nikkeibp.co.jp/article/COLUMN/20111104/372508/
プログラム実行とMPI通信を高速化
http://itpro.nikkeibp.co.jp/article/COLUMN/20111104/372509/

282 :Socket774:2011/11/16(水) 08:15:48.84 ID:ztjVMwFg
東大の次期スパコンってこれじゃないの?

東京大学情報基盤センター、スパコンシステム刷新--PRIMEHPC FX10を4800ノード
http://japan.zdnet.com/datacenter/case-study/35010521/

283 :Socket774:2011/11/16(水) 08:44:02.75 ID:CXSQmpeK
>>279
Cornerは22nmノードだから、今作ってるところ

のはず

284 :Socket774:2011/11/16(水) 20:06:40.30 ID:/RfE+OZP
64bit後発組は、先発組にくらべてデコーダ負荷が軽くなる命令セット採用しやすくなるから有利じゃね?
先発組は、互換性維持したまま性能揚げないといけないので、デコーダがどんどん複雑になるが、
後発組はデコーダがシンプルになる命令セットにできるからな

285 :,,・´∀`・,,)っ-○○○:2011/11/16(水) 20:52:47.09 ID:iPcYYMFW
PRIMERGY RX300のほうならいけるかなと思ったけどはPCIeボード刺さりそうに無いな。
RICCの入れ替えには使えそう。

286 :Socket774:2011/11/16(水) 21:31:50.36 ID:/QFnuRJw
MICが東大のスパコンで使われるって何処情報なん?
研究開発には使用してるみたいだけど

287 :,,・´∀`・,,)っ-○○○:2011/11/16(水) 21:56:55.99 ID:iPcYYMFW
研究開発だけして使わない手は無いでしょ
まあ、東大のアカポス受け入れ先の国研あたりならいくらでも入る余地はあると思ってるが。

Opteronはなくなったとは思ったがVenusは意外だった。

288 :Socket774:2011/11/16(水) 22:02:14.06 ID:lo5v5tzi
KnightsCorner来たよ
http://www.xbitlabs.com/news/cpu/display/20111115163857_Intel_Shows_Off_Knights_Corner_MIC_Compute_Accelerator.html

289 :Socket774:2011/11/16(水) 22:06:05.26 ID:/QFnuRJw
何だルーマーでもなく妄想を吹聴してただけか

290 :,,・´∀`・,,)っ-○○○:2011/11/16(水) 22:10:26.67 ID:iPcYYMFW
倍精度で1Tなら単精度だと2Tは出るのか。

291 :Socket774:2011/11/16(水) 22:10:46.59 ID:hj3oZ/F8
>>288
> Interestingly, but the KNC accelerator is not just a PCI Express accelerator like its predecessor,
> the Knights Ferry compute accelerator for software developers,
> but looks like CPU that plugs into a socket or a special adapter.
何気にすごい事書いてあるんだけど

292 :Socket774:2011/11/16(水) 22:11:24.24 ID:hj3oZ/F8
QPI版ktkrってこと?

293 :,,・´∀`・,,)っ-○○○:2011/11/16(水) 22:25:51.15 ID:iPcYYMFW
京は早くも国会版事業仕分けで予算削減対象に祭り上げられてるがMICの影響もあるんだろうな。
日本主導の技術ってなんでこうもガラパゴス化するんだろうな。

WiMAX2がdocomoのLTE帯域増加より先行するとか。

294 :,,・´∀`・,,)っ-○○○:2011/11/16(水) 22:36:45.46 ID:iPcYYMFW
あれ?ひょっとしてWestmere-EXと同じLGA1567か?
http://img.club.pchome.net/upload/club/other/2010/3/8/pics_tianzhon_1268060498.jpg

295 :Socket774:2011/11/16(水) 23:14:17.10 ID:02wRMdCb
Itaniumとか見てると、システムベンダもIntelの非主流チップの舟には乗りにくいんじゃないか

296 :Socket774:2011/11/16(水) 23:20:46.78 ID:PRQQPRpb
http://www.xbitlabs.com/images/news/2011-11/intel_knights_corner_big.jpg
これじゃメモリ帯域足りなすぎで実効性能出ないっしょ

297 :,,・´∀`・,,)っ-○○○:2011/11/16(水) 23:34:40.11 ID:iPcYYMFW
DRAM混載前提だな

298 :Socket774:2011/11/16(水) 23:35:23.14 ID:tw/xpRHh
Intelは、新アーキテクチャで技術的に優れてるけれど互換性が無い新CPUを作るも商業的に成功せず、
自社の互換性があるCPUが商業的に成功してきた

IA64でも、過去のインテルのCPUの法則とおなじようになった

いまや、PA-RISCの後継機として、HP-UX専用CPU化してるな

299 :Socket774:2011/11/16(水) 23:42:06.64 ID:t32s0ZdB
メニーコアにソフトウェアの対応は追いつくのかな?
多少ワットパフォーマンスが落ちる程度なら、従来通りのリッチコアの方が
ソフトウェアは数段書きやすいような。

300 :Socket774:2011/11/16(水) 23:47:17.16 ID:EkOolI4e
Itaniumって技術的に優れてるの?
最初から全然ダメにしか見えなかったが。

301 :Socket774:2011/11/16(水) 23:59:29.81 ID:6Og8WK5r
TSVか


302 :301:2011/11/17(木) 00:00:31.91 ID:6Og8WK5r
>297 宛な

303 :Socket774:2011/11/17(木) 00:04:54.79 ID:na+c1KzK
まあ来る来る言ってなかなか来ない技術の一つですがね……

http://202.218.219.41/news/3637
> 450mmウエハー、EUV、TSV、半導体製造の最新技術は実用化のめども立たず

304 :Socket774:2011/11/17(木) 00:22:26.40 ID:umKNouZr
短波長のEUVへ移行せずに16nmを製造するって? マジか
おじさんは頭が古いからびっくりだ

305 :Socket774:2011/11/17(木) 00:27:27.73 ID:umKNouZr
ttp://news.mynavi.jp/news/2011/11/16/009/index.html
Wide IO Mobile RAMは約1200の端子だからTSV

これはTSVの実用化には該当しないの?

306 :Socket774:2011/11/17(木) 00:40:05.50 ID:na+c1KzK
サンプル出荷は出来た。予定通り2012年中に量産も開始できるかもしれない。
しかし離陸できるかどうかは、なんともわからんのですよ。

http://pc.watch.impress.co.jp/docs/column/kaigai/20111107_488696.html
> TSVの量産準備ができているかどうかについては、JEDEC内部でも見解がわかれている。
> 今回のカンファレンスでBill Gervas氏はTSVは少なくとも2016年まではスピードイー
> ルドの面から準備が整わないと発言。それに対して、メモリの部会を束ねるDesi Rhoden
> (デジー・ローデン)氏(Chairman, JEDEC JC-42: Solid State Memories)が、「JEDECの
> 見解は、TSVは現在すでに準備ができているというものだ」と反駁する一幕があった。

307 :Socket774:2011/11/17(木) 00:42:20.21 ID:Kbxcu78w
メモリ側の方という意味では該当しますよ。ただこれはあくまで容量・速度を稼ぐためのメモリ内部のTSVであって、この後ロジックと接続するという工程があり、
そこに関してはまだこれから開発するという段階です。メモリ内部のTSVの応用ではサーバー向け大容量モジュール(32〜64GB)が開発され既にサンプル出荷されています。
兎にも角にも問題はロジックとメモリとの積層で、ここでは後工程メーカー(パッケージング、ダイ加工・接続など)、半導体ファブなどとの連携が必要ですし、
デバグ・テストも相当な苦労が要ります。それと当然ですが加工自体が相当な歩留まりを落とす要因でありますから、メリットがそれを上回るかできる限り不良品を出さないかの
努力がまだ追いついていませんでしょうね。下手に加工失敗すればウェハでは良品でも不良品になっちゃいますから。

308 :Socket774:2011/11/17(木) 00:48:48.85 ID:mNtps0XJ
マジでDRAM混載しないかな。
セットでイイじゃん、もう。
レイテンシ劇減りでみんなハッピー。

309 :Socket774:2011/11/17(木) 00:54:05.50 ID:Kbxcu78w
熱(はあと)
積層接続間の経年劣化も結構気になるところではあります。

310 :Socket774:2011/11/17(木) 00:57:13.27 ID:mNtps0XJ
フォン・ノイマンが現代を生きていたら、プロセッサの性能は違っていただろうか・・・

311 :Socket774:2011/11/17(木) 05:48:36.96 ID:gmf+EPHn
熱問題が出るような用途は
積層でなくてシリコンインターポーザ使うんでないの?

312 :Socket774:2011/11/17(木) 10:58:40.25 ID:2dHuUS9E
TSVじゃないけどTSVと同じように使える積層チップはすでにソニーが実用化して使用してるな
原理上2層までしか無理で3層以上には使えないけどMCLってやつ


313 :Socket774:2011/11/17(木) 14:46:24.90 ID:umKNouZr
2004年にはこんなこと言ってたのにな

>米Intel社は2009年の32nm世代半導体製造技術量産に向けて,波長が
>13.4nmの光源を使うEUV(extreme ultraviolet:極紫外線)リソグラフィ技術を
>研究してきたが,それが実用化に向けた開発段階になったことを明らかにした。
ttp://techon.nikkeibp.co.jp/article/NEWS/20040802/60624/

314 :Socket774:2011/11/17(木) 15:02:52.92 ID:VVYxBFrh
EUVは光源出力が量産レベルには足りない
数年前はEUVマスクの欠陥を検査する方法が無いとかいう笑えない話もあったが解決したのかな

315 :Socket774:2011/11/17(木) 19:50:39.26 ID:CIVizuwi
KLAが開発したじゃなかったっけ?
後はレジストと一番最大な問題光源だな。

未だに平均30Wで15WPHとか話しにならん

316 :Socket774:2011/11/17(木) 22:33:32.53 ID:y57/jaoC
印刷以外の方法でトランジスタ形成できないものか。


317 :Socket774:2011/11/17(木) 23:17:51.97 ID:U99XJNWw
電子ビーム直描

318 :Socket774:2011/11/17(木) 23:20:04.21 ID:mNtps0XJ
ちょw量産でwww

319 :Socket774:2011/11/18(金) 00:40:22.80 ID:XqnW1ixr
印刷以外の方法で 同じくらい安く トランジスタ形成

320 :Socket774:2011/11/19(土) 10:45:29.51 ID:xIm2Liy1
タンパク質の勝手に整列する性質を利用して云々というのを
いつぞや新聞か何かで見たような。

321 :Socket774:2011/11/19(土) 13:01:28.68 ID:PjvX6VpV
DNAコンピュータの原理を改良して配線づくりか。新しいな。

322 :Socket774:2011/11/19(土) 13:21:17.33 ID:ZQ7Ge7PR
新聞でたまに◯◯技術を開発みたいなのがでるが、
ああいったのの9割以上は実用化せずにお蔵入りだからな


323 :Socket774:2011/11/20(日) 09:37:33.71 ID:UCJ0QIk0
価格を下げたり利益を出したりするのはもっと難しい
レアメタルみたいに痛い目を見ないとw

324 :Socket774:2011/11/21(月) 23:40:51.51 ID:wUvFXnJ5
http://cybergarden.cocolog-nifty.com/blog/2011/10/amd32nmintel-f9.html

AMDの32nmは歩留まりで苦戦しているが、Intelよりトランジスタが小さい。なんで20億トランジスタが300平方mmなんだ?
GLOBALFOUNDERIESは凄いことをしている。最高だぜ!

325 :Socket774:2011/11/21(月) 23:46:43.31 ID:zfmv3eWw
>>324
The Interlagos chip has a total of 2.4 billion transitions, which means the Valencia chip has 1.2 billion.
http://www.theregister.co.uk/2011/11/14/amd_opteron_4200_6200_launch/

実は12億トランジスタでした
最初20億とでたのは間違い

326 :Socket774:2011/11/22(火) 00:38:01.26 ID:GCEFOAA9
モジュールx4とL3だけで12億超えそうだけどな

327 :Socket774:2011/11/22(火) 00:57:42.87 ID:XVOOGEAh
間違いというかてきとーに見積もっただけですかね。にしてもかなりスカスカな感じです。まあダイ写真見ても明らかですけど。
ノースブリッジは既存のK10からかなり流用したというらしいので、そこら辺のレイアウトが甘いんでしょうかね。
といっても1Module+L2で213MいくのでL3とあわせるとどう考えても足りんような気がします。

一応GPUにトランジスタを使えばかなりの密度には詰め込めるようなので、GFの32nmSOIは性能より密度重視なのでしょう。
(Llano 4Coreは1450Mに対して228mm^2で1mm^2あたり6.36M、Bulldozerを2Bとしたときの1mm^2あたりの密度はほぼ同じ6.35M)

328 :,,・´∀`・,,)っ-○○○:2011/11/22(火) 01:07:33.62 ID:reyen26Y
どっちでもいいじゃん。
トランジスタの量は結果を得るためのコストであって、消費者が求める結果(性能)そのものではない。
本当に20億も使ってこんな程度のものしか作れないならx86から逃げてもまともなもの作れないぜ。

329 :,,・´∀`・,,)っ-○○○:2011/11/22(火) 01:10:33.41 ID:reyen26Y
>>327
低クロック動作だと密度あげられるからね。
CPUでもL3キャッシュのクロックをコアより落とし密度をあげて容量増やすのは常套手段だし
(キャッシュの場合クロックだけじゃなくて平均アクセス頻度も少ないけど)

330 :,,・´∀`・,,)っ-○○○:2011/11/22(火) 22:13:22.64 ID:reyen26Y
俺のスレストぶりは半端ない

331 :Socket774:2011/11/22(火) 22:14:38.05 ID:o4wpKpTF
おまえってセコンドガレッジやってるほう?
たまには更新しろよ

332 :,,・´∀`・,,)っ-○○○:2011/11/22(火) 22:28:26.84 ID:reyen26Y
レンタル料3年分纏め払いしてそれ以降払ってない。
故に今月いっぱいで閉鎖。

333 :Socket774:2011/11/23(水) 02:02:38.97 ID:ZSEGTZX/
だんごさん、AVXやってる?
あれ速い?
SSE2系の延長で考えていい?

334 :Socket774:2011/11/23(水) 12:42:11.78 ID:vYM1HkSG
なぜここで
ム板の汗スレじゃいかんのか

335 :Socket774:2011/11/23(水) 14:24:38.07 ID:sEh8QXTP
インデックス修飾はどのような目的で作られたアドレッシングモードなのか
教えてください

336 :Socket774:2011/11/23(水) 17:28:42.10 ID:Q+Hu7iID
x = ar[3];

337 :Socket774:2011/11/26(土) 10:07:02.49 ID:RNSKGm+6
ソフトウェアトランザクショナルメモリのハードウェア支援は
Rockと共に消失?

338 :Socket774:2011/11/26(土) 11:14:55.81 ID:E514+JLY
64バイトのキャッシュラインを単位に、複数のラインを同時に書き換え監視したり
atomicに更新できたりすると、夢がひろがりんぐ。

339 :Socket774:2011/11/26(土) 13:19:37.46 ID:Tml2pRZY
>>337
BG/Qで復活

340 :Socket774:2011/11/26(土) 13:25:17.55 ID:E514+JLY
http://news.mynavi.jp/photo/articles/2011/09/08/hot_chips23_ibm/images/005l.jpg
これだ! 素晴らしい。

341 :Socket774:2011/11/26(土) 17:16:29.03 ID:s4W95dtS
tbbのcache_aligned_allocatorとatomic使えばよくね?

342 :Socket774:2011/11/26(土) 17:39:32.64 ID:gxKc78+W
>>341
TBBのatomicってよく知らないけどただのクリティカルセクションじゃないの?
だとすると複数のクリティカルセクションを合成したときにデッドロックが発生する可能性がある
STMはそれをプログラマが特に考慮する必要がない

ただ、純粋にソフトウェアで実装するとマジで重いので
バリアとかをハードウェアで実装して高速化する

343 :Socket774:2011/11/26(土) 17:41:32.96 ID:gxKc78+W
変な書き方をしてしまった
クリティカルセクション -> ロックを使ったクリティカルセクション

344 :Socket774:2011/11/26(土) 19:25:30.11 ID:E514+JLY
ロックを使った排他制御は、メニーコアにスケールさせたときに性能劣化が激しいのも問題。
クアッドコアで1コアが共有資源をロックして、他3コアを待たせるのは許容範囲でも、
メニーコアで他の15コアとか63コアとかを待たせると、結果として待ちだらけになってしまうからね。

345 :Socket774:2011/11/26(土) 19:45:43.93 ID:JqHPUTc4
ロックとかスヌープとかないようにできないんかな。
コア増えるほど頭打ちになってくじゃん。

346 :Socket774:2011/11/26(土) 20:03:55.74 ID:E514+JLY
BG/Qのmulti-versioned cacheは他アーキテクチャに広まればかなり有望かと。

347 :Socket774:2011/11/26(土) 20:09:44.85 ID:izktWWga
Itaniumにも似たような機能なかったっけ

348 :Socket774:2011/11/26(土) 20:17:57.37 ID:E514+JLY
無いと思う。
> BG/Qが実用化されると、トランザクションメモリのハードウェアサポートを
> 持つ初めてのプロセサとなる。
と本文にもある。

349 :Socket774:2011/11/26(土) 21:16:39.80 ID:s4W95dtS
>>344-345
parallel_reduceを使えばロックは結構な割合で削減できるしパフォーマンスもコア数に比例して上がる事が多い

350 :Socket774:2011/11/26(土) 21:25:49.48 ID:E514+JLY
>>349
ここでやりたいのは並列処理じゃなくて、
たとえば一つの連結リスト(同等の機能を提供する構造であれば何でもいいが)という共有資源に対して
どう効率よく並行アクセスを許すか、という話なのだ。

351 :Socket774:2011/11/27(日) 03:06:32.10 ID:g/uiiUxD
>>344
待たなかったら正常動作しないんだからしょうがない
4個と16個じゃプログラム設計から変えないとならんがメモリは一本だからヤル気出ねぇ

352 :Socket774:2011/11/27(日) 04:40:03.01 ID:S3cb5ypX
よく最適化された同期ルーチンは
ほぼmfenceのコスト
つまりロード・ストアキューのフラッシュのコスト
なんでSTMだろうがロックだろうがあんまりかわらん

まぁOpenMPですら多くの場合ろくに最適化されてない
最適化されたロックは自作するほかないという現状は問題ではあるが

353 :Socket774:2011/11/27(日) 06:25:35.19 ID:X4h1uf+C
この場合に着目している排他制御のコストは
ロック方式の場合、実際にロックが衝突してスピンで待たされる事象かと。
STMというロックのない同期(代わりにリトライはあるが)をいかに低コストで実装するかを考えたときに
IBMの回答がマルチバージョン化L2キャッシュによるハードウェア支援。
RockはL1だけだったので一歩踏み込んでいる。

しかし、トランザクション中、プロセスコンテキストスイッチとかL2をフラッシュするような事象に
対応できるのだろうか……?
ひょっとしてHPC限定なのだろうか。

354 :Socket774:2011/11/27(日) 07:22:01.68 ID:6jXdGQU6
結局、マルチバージョンとか楽観的並行制御とか
トランザクション処理で研究されてきた手法になるのか……?


355 :Socket774:2011/11/27(日) 11:01:23.94 ID:l+fyjYfS
マルチスレッドや同期の説明が詳しいアーキテクチャの本ってないの?

356 :Socket774:2011/11/27(日) 14:03:05.27 ID:8LUvJufy
これかな
http://www.amazon.co.jp/dp/4798014621

357 :Socket774:2011/11/27(日) 18:41:19.85 ID:S3cb5ypX
STMでもコア間通信をメモリシステムを介しておこなう以上
衝突がなくてもメモリオーダリングを保証する必要がある
現代のx86CPUではここにコストがかかってしまう

358 :Socket774:2011/11/27(日) 19:26:52.36 ID:+BBan95l
>>357
x86を駆逐すると言われているARMだと低コストなの?

359 :Socket774:2011/11/27(日) 20:05:56.75 ID:QOcm5FUv
>>355
まずはTanenbaum先生から学ぶのを強くおすすめしておく。
http://www.amazon.co.jp/dp/4894715376
> モダン オペレーティング システム 原書 第2版 [単行本]

360 :Socket774:2011/11/27(日) 20:06:05.30 ID:bo6+qjty
>>358
誰がそんな寝言を?

361 :355:2011/11/27(日) 23:14:49.27 ID:l+fyjYfS
>>356, >>359
thx。今度買って読んでみるなり。最近めっきりソフト事情わからんので。

362 :Socket774:2011/11/28(月) 00:49:48.08 ID:nZys/Ktu
>>360
そういえばAMDスレの気違いが言ってたな。

363 :Socket774:2011/11/28(月) 00:51:26.04 ID:OvAxwLmt
スーパーファミコンについて質問だけど、
スーパーファミコンのCPUは16bitで、
メモリ容量は64KBまでしか扱えないはずだけど、
メインRAMだけで128KBも搭載しているのはどうして?

364 :Socket774:2011/11/28(月) 00:55:52.14 ID:cYUakT45
セグメント方式を採用してるのかな?

365 :Socket774:2011/11/28(月) 01:00:00.72 ID:G530zl56
>>363
SFC/SNESのCPUは65816互換の16bitチップで24bit(16MB)のメモリ空間を持つ。
命令カウンタやアドレスレジスタは16bit長なんでバンクアクセスだけど。

366 :Socket774:2011/11/28(月) 01:00:01.50 ID:nZys/Ktu
>>363
http://ja.wikipedia.org/wiki/65816_(%e3%82%b3%e3%83%b3%e3%83%94%e3%83%a5%e3%83%bc%e3%82%bf)
アドレスは24bit。

367 :Socket774:2011/11/28(月) 01:22:03.41 ID:OvAxwLmt
なるほど。
残りの8Mbitはどうやってメモリ空間を確保しているんですか?

でもCPUが16bitだから、一度に扱えるプログラムの最大量は64KBが限度ですか?

368 :Socket774:2011/11/28(月) 01:28:21.03 ID:PWNpyKXW
君のパソコンにも付いているx86の元祖16bit CPUのi8086だって16bit CPUで1MBも扱えたよ。

369 :Socket774:2011/11/28(月) 01:32:42.11 ID:G530zl56
>>367
基本は16bitアドレス+8bitのバンクレジスタ値=24bitアドレスだが、24bitダイレクトアドレスを
扱う命令も持ってる

ttp://hp.vector.co.jp/authors/VA042397/snes/65816.html

370 :Socket774:2011/11/28(月) 01:37:38.49 ID:OvAxwLmt
つまり、16MBのメモリ空間を256個に分割し、
16bitCPUから64KBのメモリ256個にアクセスできるように見せているんですか?

371 :Socket774:2011/11/28(月) 07:23:57.83 ID:4zQT3kTK
>>357
え?
キャッシュ経由、あるいは内部バス経由で届かなかったっけ?

372 :Socket774:2011/11/28(月) 12:50:08.20 ID:j/RjBP71
>>371
チップ内バス経由でもコストがかかるということ
大体だけどロードストア片方なら50cycle両方なら100cycleくらいかかる

373 :Socket774:2011/11/28(月) 19:27:51.22 ID:4zQT3kTK
>>372
把握

しかしFXのインターコアレイテンシでかいな・・・
昨日Sandraで計ったが棒グラフが飛び出してやがる

374 :Socket774:2011/11/28(月) 19:29:37.91 ID:cYUakT45
いつもメモリアクセスが足を引っ張る。

375 :Socket774:2011/11/28(月) 21:38:22.70 ID:OvAxwLmt
ここにはSFCのCPUは64KB×256バンクと書いてある

http://www.d-colors.net/game/sfc.html

376 :Socket774:2011/11/29(火) 10:32:45.64 ID:ESmoCS4I
65816は24ビットアドレッシングに対応してるんだよね?
64180みたいに、64KB空間内に別のアドレス領域を呼び出す形じゃないと
バンク「切り替え」とは呼びづらい印象

377 :Socket774:2011/11/29(火) 18:45:38.37 ID:V664wuwR
65816は一部のアドレッシングモードで24ビットリニアアドレスに対応している
>>369のリンク先が正確

かなり嫌なCPUだった

378 :Socket774:2011/11/29(火) 18:59:50.87 ID:BsFBzaDa
マルチコアから高性能コアで進化を目指すインテルのCPU
http://plusd.itmedia.co.jp/pcuser/articles/1111/29/news008.html

379 :Socket774:2011/11/29(火) 19:03:54.17 ID:V664wuwR
でもないな
スタック相対アドレッシングが二つ抜けている

380 :Socket774:2011/11/29(火) 19:13:37.34 ID:s/l3GAGD
>>378
うん
やっぱこの企業アホだわ・・・


381 :Socket774:2011/11/29(火) 19:25:33.48 ID:V664wuwR
と、中卒ひきこもりが申しております

382 :Socket774:2011/11/29(火) 19:35:17.22 ID:BsFBzaDa
ID:s/l3GAGD

Socket AM3/AM3+マザー総合 Part4
596 :Socket774[sage]:2011/11/29(火) 01:18:48.37 ID:s/l3GAGD
>>595
オンボならソレくらい大目に見てやれよ・・・
価格から言えばC/P最強なだけある

それでもBulldozerを買った漏れは豪傑
588 :Socket774[sage]:2011/11/29(火) 01:21:01.38 ID:s/l3GAGD
>>586
俺貴族か
なら貴族らしく憐れな民をAMDへと導いていかねばならぬな

【AM3+】AMD FX総合 2台目【Bulldozer】
481 :Socket774[sage]:2011/11/29(火) 11:23:00.18 ID:s/l3GAGD
k15statはよ

【AM3+】AMD FX総合 2台目【Bulldozer】
489 :Socket774[sage]:2011/11/29(火) 17:46:39.65 ID:s/l3GAGD
>>486
実際はCPUとかの場合色々と要素があるから単純にはいかないけど
まぁ大まかにはそうだね

それでもBulldozerを買った漏れは豪傑
603 :Socket774[sage]:2011/11/29(火) 19:06:50.68 ID:s/l3GAGD
>>601
同感

マジな話、自身で使ってみるまでわかんねぇ



383 :Socket774:2011/11/29(火) 21:57:03.94 ID:M4jKqbzM
CPUは1Gヘルツぐらいにクロック周波数を抑え、
コアを16コアぐらいにした方がいいんじゃないの?

384 :Socket774:2011/11/29(火) 21:58:08.94 ID:q0VU5NZY
つ「シングルスレッド性能」

385 :Socket774:2011/11/29(火) 22:09:19.79 ID:P5LxLEmN
処理にはほぼ必ず並列化できない部分があり、アムダールの法則により、
シングルスレッド性能は依然として重要。
メニーコアCPUの代表・SPARC T1は1.4GHzの低クロックコアで始まったが、
最新のT4では3.0GHzの「普通の」コアになっている。

386 :Socket774:2011/11/29(火) 22:11:13.10 ID:lRNv0DQ2
EPIC+OoOEでも1GHzじゃC2Dに負けるな

387 :Socket774:2011/11/29(火) 22:30:11.28 ID:M4jKqbzM
>>384-385
だよね。
OSやソフトが必ずしもマルチコアに対応しているとは限らないから。

388 :Socket774:2011/11/29(火) 23:14:17.83 ID:rW23Gh8f
PGの立場からすると性能を上げるためのマルチスレッドって難しいし面倒なんだよね
排他処理だとか同期だとか何だとか
GPGPUが何だとか騒がれててもなかなか一般用途に降りてこないのはそのせい

GPGPUを本気で普及させたいなら、勝手に並列化してくれるコンパイラが必須だと思うわ
何も考えなくても勝手にMMXやSSE使ってくれるIntelコンパイラみたいにさ

389 :Socket774:2011/11/29(火) 23:24:05.91 ID:AXPxuOSq
ICCはそんなに賢くないよ。使ったことあるの?
SIMD化できるのは単純なループ位
まともにSIMDを活用するにはintrinsicsを使わざるを得ないのが現状

GPUを使った自動アクセラレーションとか実用には程遠い
OpenMP程度のセマンティクスすらGPUコードの自動生成とかできない
そもそもGPUでまともな性能を出すためにはアルゴリズムから調整しなおす必要がある
GPUにポートしたのにCPUよりワットパフォーマンスが悪化するなんてことは簡単に起きる

どうせ人力が必要ならせめて書きやすくしたいよねってことでC++AMPとかが提案されている

390 :Socket774:2011/11/29(火) 23:41:46.71 ID:s/l3GAGD
>>381
残念ながら高卒だ
まぁアホなのは自他ともに認める

391 :Socket774:2011/11/30(水) 00:37:54.44 ID:U/q7yGsd
先日のIDFでIntelはCilk Plusをアピールしてたな
Xeon用のコードを書いておけばMICへの対応はリコンパイルだけで良いと

392 :Socket774:2011/11/30(水) 00:39:55.06 ID:5tFd22DD
>>390
正直でいいなw
まあ統計では高卒以下って決して少数派じゃないんだけどね。

393 :Socket774:2011/11/30(水) 01:13:54.75 ID:Dw2YNB+j
>>378
Intelすげぇな・・・
わくわくしてきたぞ。

394 :Socket774:2011/11/30(水) 02:14:33.62 ID:sDhY0nUo
スマートフォンや組み込み向けでGPUを積極的に利用する動きが盛んだから
そこから逆輸入される展開もありじゃね

395 :Socket774:2011/11/30(水) 17:48:59.46 ID:LwEgcoZn
ゲームにしか使われてないじゃん

396 :Socket774:2011/11/30(水) 20:15:28.61 ID:j5ymgfwb
米クレイ、京大からスパコン受注 富士通「京」に競り勝つ
スーパーコンピューター専業の米クレイ(ワシントン州)が、京都大学の次期スパコンを受注した。
学術情報メディアセンターに納入、2012年5月に稼働させる。旧帝大7校が海外製スパコンを主要機種として採用するのは初めて。
京大は1969年以来、富士通の牙城だった。受注額は外部記憶装置などを含め40億円未満。クレイは今回の受注を機に、国立大学や公共研究機関への販売を強化する。

397 :Socket774:2011/11/30(水) 20:25:41.66 ID:aBgYbdRO
>>388
ソフト屋さんでもマルチスレッドってそんなに難しいの?
俺はBASICやC、Javaの基礎しか知らないタコなんだけど。

マシンを会社組織になぞらえて、この処理は山田さん(山田スレッド)、この処理は鈴木さん(鈴木スレッド)
忙しいときにはみんなで手分けする、呼び出し(メッセージ)をやり取りして。
単純だけど大量の処理は下請けの爺費有(GPU)さんに外注する。

そんな素人の考えじゃだめなのかな

398 :Socket774:2011/11/30(水) 20:56:23.47 ID:5mvHBE8Z
>>397
山田さんの仕事の結果次第で鈴木さんの仕事が変わるような処理が多い



399 :Socket774:2011/11/30(水) 21:27:41.42 ID:sDhY0nUo
>>395
んなこたぁない
普通の操作の画面遷移にGPU支援使うのはもう当たり前になって来てる
GPGPUもどんどん使っちゃおうぜって流れも

400 :Socket774:2011/11/30(水) 21:31:29.94 ID:BSOM0wor
>>397
「アムダールの法則」
www.ne.jp/asahi/comp/tarusan/AMDAHAL.jpg

401 :Socket774:2011/11/30(水) 21:41:50.37 ID:BSOM0wor
間違えて画像だけのそれも不完全URL張ってしまった…

古いがわかりやすいブログ記事
http://www.ne.jp/asahi/comp/tarusan/main72.htm
同トランジスタ数でコア数を変えた場合の性能グラフ
http://www.ne.jp/asahi/comp/tarusan/AMDAHAL.jpg
HTやBulldozerのような手法が有効な理由のグラフ
http://www.ne.jp/asahi/comp/tarusan/SMT-CMT.jpg

402 :397:2011/11/30(水) 22:02:46.68 ID:aBgYbdRO
進捗報告会議・対応再検討スレッドも必要になるのか
動的にコードを書き換えて再コンパイル・リンクみたいで訳わからなくなるわ

403 :Socket774:2011/11/30(水) 22:07:08.66 ID:+rXwWkIl
>>396
クレイってことは、これOpteronなのか?

404 :Socket774:2011/11/30(水) 22:09:59.15 ID:2uIjQAjY
>>397
> 忙しいときにはみんなで手分けする、呼び出し(メッセージ)をやり取りして。
手分けする処理を予め決めておかないといけない
呼び出しあってデッドロックが発生するとアウト

とはいえ、マに任される現状のままではマルチスレッド化は進まないね。
コンパイラやハードの支援も欲しい。
依存関係がなくて空きコアがあれば、自動でスレッドを分ける、
くらいのコンパイラとハードは作れるはず。


405 :Socket774:2011/11/30(水) 22:14:42.80 ID:6LhwoOoq
仮想化サーバのように、無関係な処理を持ってこない限り、
依存関係がない、ということは無い。

406 :,,・´∀`・,,)っ-○○○:2011/11/30(水) 22:29:33.52 ID:BLsBPrps
>>403
Xeonもあるからなぁ。
Magny-Coursからのアップグレードならともかく、Opteronを今選ぶ意味ってあんま無い気がするんだが。

407 :Socket774:2011/11/30(水) 22:30:14.73 ID:oo875wwP
>>404
C言語の仕様で依存関係の有無を判定するのは無理だろ
ポインタで指された先の領域がどこかでオーバーラップしてるかもしれないんよ

408 :Socket774:2011/11/30(水) 22:32:01.92 ID:oo875wwP
>>406
XE6らしいよ
http://dreammakerk.blog92.fc2.com/blog-entry-5773.html

409 :Socket774:2011/11/30(水) 22:56:30.75 ID:QJ/zeYrz
2位じゃダメですね、入札も

410 :Socket774:2011/11/30(水) 23:15:21.40 ID:jT2q8XBk
>>397
マルチスレッド自体は別に難しくないぞ
山田さんが営業して、鈴木さんが電話番して、佐藤さんが会計処理するみたいな感じなら

難しいのは3人で分担して会計処理をして早く仕事を終わらせろって言われた場合
分担をきちんと決めておかないと作業が重複して無駄になるし、
二人以上同時に同じ書類を見られないから、誰かが使ってたら使い終わるまで待たなきゃいけなかったり
Aを処理するためにはBとCの情報が必要で、Bを処理するためにはDを…なんて場合もあるし

そういった諸々を勘案してプログラムを作るのが面倒くさくて難しいってお話

411 :Socket774:2011/12/01(木) 15:14:20.44 ID:Do65qa+4
64kBの頃にはメモリーを確保するのに少しの量、少しの期間の占有も
無駄は省かなければ、みたいな感じがあったが、
今、メモリーを少し余分な期間や分量を確保してもあまり気にしていない
プログラマは多いだろう。保守性の高さとか、メモリー最適化よりも
優先したいことことがいくつか考えられる。

今はせいぜい1ソケット20スレッドくらいだから、どのスレッドも常に
フル稼働するのがハードを生かすよいソース、と考えている。
もしも使えるスレッド数が数桁ほど増えたら、立ち上げたスレッドに
暇そうにしてる時間があってもあまり気にしなくなるかもしれない

412 :Socket774:2011/12/01(木) 15:36:56.78 ID:wde0wUa6
リッチコアはコスト高いが、
メニーコアのインターコネクトはもっとコスト高い。

413 :Socket774:2011/12/01(木) 15:37:35.92 ID:Do65qa+4
>>403
12年のはOpteronだな。予定通りに14年に追加があるならそっちは
インターコネクトがPCI-EのCascade だから、その時点で性能のいい方になるだろう

414 :Socket774:2011/12/03(土) 02:14:38.21 ID:0PWAawPk
ブルの評価が、意外と悪くない
ttp://news.mynavi.jp/special/2011/zambezi2/index.html
大原評

・サーバ用のCPUとして使う限りはSandyに匹敵する性能
・これをデスクトップPC向けに流用したことが論外、暴挙。
みたいな感想が書かれている。
デスクトップPC用のCPUとして使う限り、PhenomIIと比べても少し劣る性能しか出ない。とね。

415 :Socket774:2011/12/03(土) 02:35:04.73 ID:go6ULmKY
大原自身は最初のころより随分発言が変わってるけどなw

http://ascii.jp/elem/000/000/489/489200/index-2.html

>独立した3つのALU命令と3つのLoad命令であれば、実質1.5サイクルで処理できることになる。
つまり、単純に「IPCが減った」と言い切れない構成に変わったわけだ。
Load命令+ALU命令であっても、実質的なスループットはむしろK10よりも向上する可能性が高い。

それが

>本来ならIPCが3→2に下がっているのだから、これを補うためには動作周波数を50%引き上げる必要がある。

416 :Socket774:2011/12/03(土) 03:14:49.56 ID:OjyaBmr3
庇おうとして庇いきれなかった
最低限現行アーキテクチャと同等の性能はあるだろうという低めの予想をも下回った

417 :Socket774:2011/12/03(土) 03:16:16.80 ID:dcYG1PdD
1年くらい前はAMD自身がK10→BullはIPCも向上するって言ってたから

418 :Socket774:2011/12/03(土) 04:07:35.11 ID:cj9P9sX8
実行ユニットが減ったから2命令でぴったり張り付いてるグラフはある意味笑えた

419 :Socket774:2011/12/03(土) 06:50:25.61 ID:2a8NDgog
相変わらず長い


420 :Socket774:2011/12/03(土) 13:36:44.51 ID:qVme7aJ5
噂: 3GHzCPU、768MBRAM…国内開発者がWii Uの具体的なスペックをリーク
http://gs.inside-games.jp/news/comment.php?id=20883&page=2

421 :Socket774:2011/12/03(土) 14:17:45.46 ID:Jvwn3hJZ
G3系と970系で若干違うとはいえ
Broadwayの拡張がXenon風PowerPCのクアッドというのはわかりやすいが、
DRAM内蔵等で差異化できないと
本当にXbox360を遅れて出しただけになってしまうな。

422 :Socket774:2011/12/03(土) 14:23:15.09 ID:2a8NDgog
PCの派生品で作るようになってからまるで面白くなくなったなゲームコンソールも
OSも順調に重くなってるようだし

423 :Socket774:2011/12/03(土) 16:59:42.34 ID:MGMqsxof
2Gbitチップを3枚か4枚重ねたら768MBか1GBだし
噂が本当ならダイスタックなんだろうな。
でも45nmなら熱が多いし、スタックはDRAMだけでCPUとはMCMかも

424 :Socket774:2011/12/03(土) 17:51:34.52 ID:OjyaBmr3
そういえば、Broadway製造元のこんな話を読んだばかりだった。

http://www.geocities.jp/andosprocinfo/wadai11/20111203.htm
> 2011年12月1日にIBMとMicronは,IBMがMicronのHybrid Memory Cubeを製造すると
> 発表しました。製造プロセスは32nmのHigh-K Metal gateで,IBMのEast Fishkill
> 工場で製造されます。

任天堂は必ず変なメモリを積んでくるが、まさかなあ……

425 :Socket774:2011/12/03(土) 18:24:39.35 ID:cj9P9sX8
いままで1T-RAMとかeDARMとか実績たっぷりすぎるし容量より速度取るとか2012年に出すにはメモリ少なくねとかほんとにやりそうで怖い

426 :Socket774:2011/12/03(土) 20:36:14.85 ID:VsY2lY6Z
チョニーと任天堂は変なメモリを積む上に容量を少なくするから、
PCでのゲーム製作技術が応用できないし、
少ないメモリ容量をやりくりする事に終始するので最悪。

PCで主流となっている汎用メモリをたくさん積むのが一番良いのに何故それをやらないのか?

427 :Socket774:2011/12/03(土) 20:43:42.76 ID:XhgvODwK
容量より帯域

428 :Socket774:2011/12/03(土) 20:47:44.78 ID:0PWAawPk
>>426
たぶん、PCとは比較にならんほどにコスト削減圧力が強いからだろう。

と思うのだが、PS3とかの値段を考えれば、もうちょっとメモリ増やせって思うのが普通だよな。
出現当初はともかく、今もこの値段っていったい... とついつい考えてしまうレベル。

PC用メモリが今のように格安で売られる時期には特に強く思う。

429 :Socket774:2011/12/03(土) 20:56:39.56 ID:1Vwxncur
発売時期も勘定にいれなよ

430 :Socket774:2011/12/03(土) 21:07:44.51 ID:78eB8o52
ヘテロジニアスだとか新CPUをギリギリまでコストかけて頑張っても
そのしわ寄せコストの折り合いでメモリサイズまでギリギリじゃ
開発者にいったい何をやらせたいのか
片手落ちもいいところ

431 :Socket774:2011/12/03(土) 21:40:23.95 ID:MGMqsxof
やっぱ帯域のために容量は絞り込んでると思うな

PCでメインメモリが遅いのに見栄えのいいゲームができるのはGPU-VRAM帯域が
広いからと、CPUが多くのキャッシュを積んでメインメモリの遅さを
隠蔽しているから。キャッシュのふんだんなCPUはダイが大きくなって
高くつくし、VRAM専用帯域を設けるハードもチップ数が増えて高くつく。
PS3を企画した頃のようなコストのかけ方は今は難しいだろう

432 :Socket774:2011/12/03(土) 22:05:01.06 ID:pHu+kt/h
変なメモリを使うのはDDR3とかだと帯域稼ぐのにビット幅を増やさないといけないからだよ
ビット幅を増やすとボードのコストにそのまま跳ね返るから

コンシューマゲーム機は長い期間で大量の部品を調達するから
変な部品を使う方がまだコスト削減できる

433 :Socket774:2011/12/03(土) 22:15:45.52 ID:LgGuUF7E
PS3や箱は良い線いってたと思うけどな
まだPS2時のHL2みたいなソフトがPCで出てきてないし
新ハードは何処も厳しそう
頓挫した物理演算チップとか変化球で載せてこないか期待してるけど
それなら部品数削ってGPUに金かけた方がよさそうだし

>>432
初期の箱のGDDR3配線はぐちゃぐちゃだったな
PS3のGDDR3はGPU上に載せてたけど、メモリクロック下げたんだっけ

434 :Socket774:2011/12/03(土) 22:18:49.02 ID:K/AEA7Z2
ゲハは無知なんだから黙ってろ

435 :Socket774:2011/12/03(土) 23:10:16.28 ID:EXilt/Jd
ゲハすぎるわ

436 :Socket774:2011/12/04(日) 00:39:59.81 ID:QVduBP7n
そもそもPCじゃないんだからメモリ容量そんなにいらない。

437 :Socket774:2011/12/04(日) 00:48:37.27 ID:oCAY8S/P
>>436
少ないだろバカ

特にPS2とPS3は酷すぎる

438 :Socket774:2011/12/04(日) 00:55:39.34 ID:JJWNyvSc
RING基板は1GBらしいから少ないけど全然ダメという少なさじゃない。
とはいえ、アップグレードせずに数年使い回すのだから1GB越えるくらいじゃないと。

439 :Socket774:2011/12/04(日) 01:40:45.81 ID:qd4UWlbn
PSPも初期設計どおりeDRAM 8MBのみだったらいまごろ楽しかっただろうな

PC-FXにはメインメモリの増設スロットがあったなそういえば

440 :,,・´∀`・,,)っ-○○○:2011/12/04(日) 11:55:28.57 ID:i89MGNmc
>>417
IPCが向上するなんて言ってないぞ。シングルスレッド性能が向上するとは言ってたが。
(もちろん「XOPやFMA4などの新命令を使わずにできる」なんてことは言ってない)

441 :Socket774:2011/12/04(日) 12:23:56.34 ID:Rre4N0Rl
コンソールはハード決め打ちなこともあって
メモリが足りないのは工夫すればなんとかなるんだけど
帯域とかレイテンシはわりと工夫の余地がなく、致命的に表現を制約するんですよ。
5年同じハードを使い回す≒工夫に費やす時間の猶予はある、という観点で
容量よりも性能が優先されがちです。

442 :Socket774:2011/12/04(日) 13:20:44.26 ID:wx/hqeKO
K10をFMA4やXOP、C6ステートに対応させりゃ良かったんじゃねというのは禁句なんでしょうか(´・ω・`)

443 :Socket774:2011/12/04(日) 14:00:59.47 ID:QMlML57q
>>442
TimnaのためにP6の要素を分解して再構成したチップをつくり、
さらにBaniasへと進化させたイスラエルチームのような別チームをAMDが持つ余裕があれば、
並行してそういうのを作ることもできたんじゃないの?

444 :Socket774:2011/12/04(日) 14:30:59.65 ID:Qtx7SijC
鯖用とPC用に異なるアーキテクチャのCPUを並行開発できないAMDの弱点が、
Athlon64では逆に有効手になってたけど、
今回のブルでは順当にデメリットが大噴出した。

ということだよね?

445 :,,・´∀`・,,)っ-○○○:2011/12/04(日) 14:56:28.12 ID:i89MGNmc
>>442
Llanoが未だにSSSE3すら対応してない(Core 2登場から5年も経ってるにもかかわらず)。
あのデコーダ改良できる人いないんじゃないの?

446 :Socket774:2011/12/04(日) 15:39:32.86 ID:ekxDfIq4
作った本人以外でも改良できるような骨太の開発体制の構築って難しいよな
中小企業はどこも苦労していると思う

447 :Socket774:2011/12/04(日) 17:03:24.04 ID:u38wn0LR
COBOLが思い浮かんだ俺。

448 :Socket774:2011/12/04(日) 18:38:29.17 ID:YSZkohac
>>440
IPCが上がると言ってるぞ
ttp://www.xtremesystems.org/forums/showthread.php?257927-AMD-s-Bobcat-and-Bulldozer&p=4531199&viewfull=1#post4531199

449 :Socket774:2011/12/04(日) 18:43:42.34 ID:ekxDfIq4
モジュールあたりのIPCだったんだよ!!!1!

450 :Socket774:2011/12/04(日) 18:50:38.73 ID:3uqlOV77
な、なんだtt(ry

451 :Socket774:2011/12/04(日) 19:43:44.26 ID:wx/hqeKO
>>446
ファブレスになった以上最早R&D部隊の確立無くしてAMDの存続は成しえないから頑張ってほしいなぁ

まぁあの取締役会だからこれからもお馬鹿な決定をいっぱい寄越してくれそうだけどさ・・・

452 :Socket774:2011/12/05(月) 20:40:01.96 ID:w2YwVfa9
>>441
でもPS3でXDRAMを採用した事は評価できない。
当時からDDR3SDRAMは存在していたし、
今でもDDR3SDRAMが現役。

453 :Socket774:2011/12/05(月) 21:05:19.37 ID:ZQ/O2CSZ
>>452
当時のDDR3じゃPS3のXDR RAMの帯域出せないだろ

454 :Socket774:2011/12/05(月) 21:07:11.74 ID:iGMiZNca
黄石。

455 :Socket774:2011/12/05(月) 21:21:04.85 ID:w2YwVfa9
>>453
メモリは帯域よりも量が重要だよ。
PS3はメモリの量の少なさが足枷となり、
ライバルのXBOX360やPCゲームに勝てないし、
少ないメモリをやりくりする為にソフト開発費が高騰している。

456 :Socket774:2011/12/05(月) 22:37:26.00 ID:pEGnq++x
1チップの帯域とシステムの帯域。ゲーム機はコストがタイトで
チップ数を減らしたいから、同じ容量、同じシステム帯域でもチップ数が
少なくなる速いインターフェイスを選ぶ。

457 :Socket774:2011/12/05(月) 22:48:08.31 ID:5plYKqOo
バカが沸いてるな

458 :Socket774:2011/12/05(月) 22:52:28.70 ID:CgxaGLhl
少なくとも、456の言うような考え方でハードを作ってる会社があるのは事実だと思うんだ。
その方向性が妥当かどうかとは別問題として。

その奇抜な発想が突き抜けていたのがPS2のローカルメモリのビット幅の広さ。

結局、後継ハードで互換性を確保できなくなった原因でもあるんだろ?
それに、時間が経つと製造コストが下がる、はずがなぜか下がらなくて赤字を出しやすかったり。

459 :Socket774:2011/12/05(月) 23:13:08.93 ID:si5ddA9c
PCを超えるゲーム機は出ないってことになる
ま、アーケードで唯一がんばてるtypeXがPCだしな

460 :Socket774:2011/12/05(月) 23:47:25.77 ID:K5X7vRTH
戦いは数だよ

461 :Socket774:2011/12/05(月) 23:57:03.75 ID:iGMiZNca
PCは金かけただけ良いグラフィックスで楽しめるのがイイなぁ。
この拡張性は魅力だよ。
選択肢は多いに越したことない。

462 :Socket774:2011/12/06(火) 00:11:38.96 ID:vpYBVsuC
登場時点でハイエンドPCより描画性能が高いというのはPS2が最後だったからね

PS3/XBox360以降のコンシューマゲーム機のアドバンテージは
1)同一性能であれば低コストであることと
2)PCでは最低限遊べる環境を低めに設定する必要があるがその必要がないこと

今後数年でIntel内蔵GPUが十分な性能を持つようになれば
ゲームを遊べるレベルのPCが普及することになるので
これらのアドバンテージは消失する

となるとあとは さらに高性能に逃げるか 特殊なUIで差別化するしかない
でもMSはKinectをPCに開放してるしあまりゲーム機本体に囲い込む気はなさそう

463 :Socket774:2011/12/06(火) 00:16:44.27 ID:ZOtQUQa5
3)電源とゲームメディアを入れるだけでゲームが出来る

これ、大きいぞ。子供でもお年寄りでも簡単にできるからな。

464 :Socket774:2011/12/06(火) 00:22:12.88 ID:V03LSFq0
しょぼい考察聞かされる身にもなれよ
2+1個しか挙げられないってどんだけ低能だよw
ゲハはおとなしくロムってろ

465 :Socket774:2011/12/06(火) 00:34:31.53 ID:eRNtx7t8
取り敢えずPCあればゲーム機イラネ


466 :Socket774:2011/12/06(火) 00:42:14.71 ID:ICZgaaMK
>>465
ゲーム機用のソフトの大半がPCでもプレイ可能な状況じゃなけりゃ
そもそも二択が成立しないんだが

467 :Socket774:2011/12/06(火) 00:43:54.96 ID:ooBSftg1
そうなった今ゲーム業界側はどういうハードを構想するべきなのかね。
PCのGPUが高速化しちゃった今ゲーム向きに差別化できるCPU・GPUは何か。

まあやりようがないってのが答のような気もする。

468 :Socket774:2011/12/06(火) 00:44:07.33 ID:nkntBAEY
>>462
VRAM4MBのゴミのどこがハイエンドなんだよw
一年以上前に発売されたドリームキャスト以下のメモリ容量。

>>463
>3)電源とゲームメディアを入れるだけでゲームが出来る

PS3と箱○のソフトは、電源とゲームメディアを入れるだけでは遊べないから糞
家庭用ゲーム機のアドバンテージを自ら放棄している

469 :Socket774:2011/12/06(火) 02:00:00.06 ID:+sMuGSqC
まあ、GSはシェーダ以前の古典的なハードで
フィルレート=帯域命の設計だからな

470 :Socket774:2011/12/06(火) 05:39:52.78 ID:HMCNVH6p
DirectX7の世代の範囲で、
速度を優先して機能を削減したような構造だよね。

テクスチャを張ると速度半減ってのも大きな制限の一つだけど、
VRAM容量が小さすぎるからテクスチャを利用すること自体が困難だから、
速度半減という弱点は実質的にはあまり関係ないか。

カタログスペック通りの高性能を発揮させるためにはすさまじく労力が必要な厳しい構造だったんだよな?

471 :Socket774:2011/12/06(火) 08:27:01.95 ID:qsGC0f82
>>462
そもそも性能の要らない2DゲームみたいなものだってPCでやる人は少ないわけで
コスト云々以前に市場がない気が…
ハイエンドなんて志向する客はさらにほんの一部なんだから、高い金出してグラボ買ってね!で棲み分け出来てると思う

472 :Socket774:2011/12/06(火) 20:27:53.02 ID:nkntBAEY
PS2の糞仕様の所為で、どれだけ多くの日本のソフトハウスが潰れ、
どれだけ多くの日本のソフトハウスが開発能力や競争力を失ったか知れない。

473 :Socket774:2011/12/06(火) 20:29:47.18 ID:nkntBAEY
>>471
廃スペックゲーム機が生き残る道は、
アーケード筐体と同じアーキテクチャを採用し、
業務用のソフトがそのまま家庭用でも動くみたいにしないと厳しいね。

でも、今だともうネオジオみたいなやり方は利益を出せないだろうな。

474 :Socket774:2011/12/06(火) 20:39:15.12 ID:OAsF2Vhf
いつからここはPS2を叩くスレになったんだ

475 :Socket774:2011/12/06(火) 23:02:34.54 ID:JfSoh2Tt
>>473
アーケードってx86のCPUかつNvやAtiのGPUなどPCのシステムそのものか、それに近い仕様で動いてるやつ多いみたいだぞ。
しかもハイスペックでも何でもない感じで

OSもWindows系を使ってたり

476 :Socket774:2011/12/06(火) 23:19:18.85 ID:3QucKl2k
アーケードは全部Winだよ
コスと考えたらあたりまえだけど

477 :Socket774:2011/12/06(火) 23:27:50.39 ID:CrERfVp2
eX-BOARDはC7とCN700(UniChrome)

478 :Socket774:2011/12/07(水) 01:33:59.16 ID:o3fwvsWW
久夛良木健氏が語る、PlayStation 3とCellの正体
http://pc.watch.impress.co.jp/docs/2003/0901/kaigai015.htm

>[久夛良木氏]  次は面白い。(PS3は)ただ垂直(ネットワークしない状態)で見て、
>単なるゲーム機だと思ってやってもすごいと思う。

>だから、(ソフトウェア開発が)ナイトメアにならないようにしないと……。

ナイトメアになっちゃったね。

479 :Socket774:2011/12/07(水) 13:48:40.43 ID:pqQ/Om99
今のアーケードマシンって随分化石染みたスペックの物使ってるんだな。
ハイエンドでも。まあ組込み系だから当然だけど。

480 :Socket774:2011/12/07(水) 19:04:32.16 ID:9pABluLs
アーケードは一台あたりにかけられるお金が違うし、逆に台数は出ないから
ハイスペックな汎用PCそのもの方がいいに決まってるだろ。

481 :,,・´∀`・,,)っ-○○○:2011/12/07(水) 21:47:20.51 ID:xKk7Jj7U
PCとは違って連続稼動が求められるから多少はPCよりは周回遅れの「枯れた」パーツ使うことになるね。

といっても組み込み向けとして売られてるCPU・チップセットって現状、型落ち品を
高く売りつけるための手段になっている気はする。
(最新プロセスのCPUは連続稼動に耐えられるほど安定してないなんて言っちゃったら
Xeonは誰も買いません)

482 :Socket774:2011/12/07(水) 22:10:00.73 ID:Mefp1xgV
組み込みマザーボードメーカが
ASUSみたいなメーカみたいに
神速で作れないだけだろうと思う

483 :Socket774:2011/12/07(水) 22:47:20.51 ID:V9HR29/A
劣悪環境前提ってのも考慮に入れてな

484 :Socket774:2011/12/07(水) 23:24:51.32 ID:cbOImle5
PCゲーや家庭用ゲームがこれ程発達した現代では、
既にアーケードゲームの存在意義は無くなったと言っても過言じゃない。

485 :Socket774:2011/12/07(水) 23:41:54.62 ID:tic2SsQx
大型筐体ゲームを家に置きたいとは思わんがな。

486 :Socket774:2011/12/07(水) 23:42:57.40 ID:cbOImle5
しかも一台で自動車が買える程の値段がする
問題はアーケード筐体の方で、家庭用ゲーム機である程度代替できてしまう

487 :Socket774:2011/12/07(水) 23:58:26.43 ID:JeHEETRm
>>483
そこだよな、なるたけ消耗系部品点数を削りつつ必要なレベルを維持できないといけない
その上原価も安く・・・となると最新は・・・

488 :Socket774:2011/12/07(水) 23:58:33.28 ID:qU5C+c1o
かなり以前からゲーセンの主役はプライズやメダルや体感筐体機で
ビデオ表示性能を誇示する時代じゃなくなってるし。

489 :Socket774:2011/12/08(木) 00:16:27.21 ID:pgKkSncP
あとは特殊な機材が必要なヤツとか。
三国志大戦とかWCCFとかガンダムカードビルダーのようなカードゲームや
戦場の絆みたいな体感ゲームとか。

見れば見るほど特殊なCPUやらアーキテクチャーは必要ないな。

490 :Socket774:2011/12/08(木) 00:20:39.82 ID:Z5x4kOaj
Teslaとか載せて家庭用PCとは一線を画するハイエンドスペックを実現して、
それで高いインカムが確実に望めるならそうするだろうけど、
あんまり期待できないよね……
客にアピールするのは、幸か不幸かそこじゃない。

491 :Socket774:2011/12/08(木) 01:00:46.86 ID:2klS0qwD
京を繋いでゲームを作ったら良いんじゃね?

492 :,,・´∀`・,,)っ-○○○:2011/12/08(木) 03:51:49.02 ID:s0p69/Mg
15年位前にゲーム雑誌で読んだけど北米じゃ一番近いゲーセンまで10kmなんてことも珍しくないそうな
(人口密度の高い日本ですらかなり潰れてるし今はもっと酷いんじゃないのか?)

巨大冷蔵庫に食料大量に詰め込むのと同じ感覚でゲームに金かけるのがゲーム大国アメリカ

もっとも、その消費志向も変わりつつあるけどね。
丁度日本のコンビニみたいな品揃えの小型店舗が増えてるらしい。

493 :Socket774:2011/12/08(木) 08:17:36.36 ID:fiRGPmzm
へぇ〜、たしかにアメリカでゲーセンってイメージないなぁ。

494 :Socket774:2011/12/08(木) 08:33:16.10 ID:Z5x4kOaj
映画のTRON見てよ

495 :Socket774:2011/12/08(木) 09:17:13.35 ID:x69JnpA9
>>485
格闘ゲーやシューティングゲーで使われるような筐体なら重さ100Kg(家庭用400L冷蔵庫と
同じぐらいの重量)だから、工夫すれば家に置けないこともない
(ただし幅が70cmはあるから、分解しないとだめだな)http://
>>492
海外でゲーセンあると、ストリートギャングや麻薬売人の類がたむろして
治安的にもよくないからゲーセンがあまりないと聞いたが?

後、今はx86CPUでコプロのx87など使わなく、FPU性能もSpecCPUベンチを
見る限りじゃ他アーキと遜色ないのに、「x86=FPU遅い」の扱いをされてるのは
何故?

496 :Socket774:2011/12/08(木) 09:24:02.09 ID:Z5x4kOaj
レジスタ8-16本しかないからじゃない?

497 :Socket774:2011/12/08(木) 11:52:33.51 ID:ot2kYU6c
>>495
固定観念て奴ぢゃね?

498 :Socket774:2011/12/08(木) 12:55:55.72 ID:npraXjtK
日頃の行いだよ
必要な命令を載せるよりクロック上げる方を優先すんな

499 :Socket774:2011/12/08(木) 13:24:07.50 ID:PZTbgDbu
浮動小数点演算が主用途と割り切って128bit×128本とか載せてるやつに比べれば
そりゃ遅いよね。しかし汎用CPUである限りはレジスタをむやみに増やすわけにもいかず。

500 :Socket774:2011/12/08(木) 14:16:16.65 ID:x69JnpA9
>>496
Pen4以降は物理「レジスタ増えてる
>>498
x86はCISCだから命令の数は多い
>>499
おそらくCELLのことを言ってるのかな?
しかし、CELLのSPE1つの浮動少数性能はいくつかのサイトを見ると実効で
23Gflopsでこの数値はCore2 1コア分のFPU実効値22Gflopsとあまり変わらない

そうか、CPU関連のサイト製作者は何気にアンチx86RISCマンセーみたいな人が
多いから、叩きたいだけのかも。


501 :Socket774:2011/12/08(木) 17:09:11.57 ID:VIBtiN/+
なに勝手に結論出してるの、ダイサイズ考えろよ

>>499の考えで問題ないだろ

502 :Socket774:2011/12/08(木) 17:45:45.30 ID:zjTFlDhH
DreamcastのSH4のSIMD
PS2のVU
PS3のCell
とゲーム機向けのCPUは当時としてはFPUにリソースを割いたものが多かったからな


503 :Socket774:2011/12/08(木) 18:37:59.65 ID:pgKkSncP
いっそ中国の新型CPUを使ったゲーム機とかでたら面白そうだが。
GPUどうすりゃいいのかわからんけど。

504 :,,・´∀`・,,)っ-○○○:2011/12/08(木) 21:30:00.19 ID:I95SPawS
>>499
別に遅かないよ。
i7-2600あたりでDGEMM 100GFLOPS出せるし実効性能はかなり高い。
SIMDの物理レジスタは百数十本とかあって、リネーミングして並列動作させてるから
FPの稼働率を高められる。
むしろ論理レジスタが少ない方が動的スケジューリングしやすいんじゃなかったかな。
(いまやC++ネイティブと遜色ないパフォーマンスを得たJavaVMなんか1レジスタのスタックマシンだし)
安藤さんとかは故意にこのあたりをミスリードしていると思う。

505 :Socket774:2011/12/09(金) 00:22:11.85 ID:h+0V9M4A
>>504
団子のそのレスも故意にいろいろミスリードしてません?

506 :Socket774:2011/12/09(金) 00:26:06.36 ID:2o4dp7+U
>>503
爆発するから気を付けないといけないな

507 :Socket774:2011/12/09(金) 01:04:24.56 ID:d+Ytikgd
>>506
そっちでも面白いけど、ゲーム機になってない主要RISCってAlphaとSPARCだろう。
SPARC独自実装してる富士通かAlphaパクった中国に新ゲーム機を期待したい。

508 :,,・´∀`・,,)っ-○○○:2011/12/09(金) 01:07:59.26 ID:HaOcUE8E
>>505
レジスタリネームを備えたアウトオブオーダ実行型のアーキテクチャだと
論理レジスタ本数の多い少ないはそれほど性能に影響しないね。

インオーダのAtomとかなら確かにレジスタ16本じゃ性能出すの辛いって思うけど。
でもそれこそどうにでもなるんじゃね?
巨大論理レジスタを表現するためのオペランドフィールドを増やすとか可変長のx86のほうが柔軟に出来ると思うけど

SPARCのISAは1オペランドあたり5ビットしか指定フィールドがないからさ、
京に採用されたHPC-ACEでは、前置命令に拡張フィールドの3ビット(×3フィールド×2命令分)を
収めることで、強引に256本のレジスタを表現してるわけで。

そういう手を使うならx86でも(プリフィックス新設すれば)可能だと思うんだよね。
実際MICはSIMDの論理レジスタを32本に増やしてるし。

509 :Socket774:2011/12/09(金) 01:10:06.79 ID:vkP4u9nJ
HPCで使われてgreen500で京より上にも入っているXeonは2GHz台、
デスクトップのパフォーマンスクラスは3GHz台、
他のプロセッサよりも電力的に有利な製造プロセスにも関わらず
デスクトップ並みのシングルスレッド性能の高い版では
greenで上位に入れないのがx86の限界

510 :,,・´∀`・,,)っ-○○○:2011/12/09(金) 01:17:13.26 ID:HaOcUE8E
詭弁だな。
それを言うなら京のVenusも2GHzでインオーダ実行だからデスクトップPCの
シングルスレッド性能には程遠い。

x86なみにシングルスレッド性能の高いCPUを例示してみてよ。

511 :Socket774:2011/12/09(金) 01:17:41.70 ID:SlhJ+Auu
fmaddが無いだけ

512 :Socket774:2011/12/09(金) 01:27:03.40 ID:FbvidVGx
>>509
POWER6さんの悪口はそこまでだ

513 :,,・´∀`・,,)っ-○○○:2011/12/09(金) 01:28:02.96 ID:HaOcUE8E
BlueWatersって事実上x86(MIC)に負けたんだよな

514 :Socket774:2011/12/09(金) 01:50:44.94 ID:vkP4u9nJ
>>512
でもPOWER7 は自身の最高クロックのままgreenで100以内に
いくつもランクインしていて、ある意味男らしい

515 :,,・´∀`・,,)っ-○○○:2011/12/09(金) 01:52:24.43 ID:HaOcUE8E
SPECpower_ssjのほうには登録しないのがIBMクオリティ

516 :Socket774:2011/12/09(金) 01:53:57.04 ID:U2+rp+qb
,,・´∀`・,,)っ-○○○ )´Д`;) Oh...

517 :Socket774:2011/12/09(金) 03:04:51.91 ID:I/NYD7pb
ワットパフォーマンス重視が頭打ちになったらどうするんだろうね…
現在のスパコン並のマシンがコモディティ化するだけかい?

518 :Socket774:2011/12/09(金) 03:08:55.81 ID:lvgCYANa
シュリンクや回路の最適化など製造面での進歩がメーカーを問わず全ファブまで行き渡ったら、最も効率的なアーキテクチャ以外の演算装置は淘汰されるだろうか?

519 :Socket774:2011/12/09(金) 03:46:39.98 ID:d/CXajCs
>シュリンクや回路の最適化など製造面での進歩がメーカーを問わず全ファブまで行き渡ったら
その前に非シリコン半導体が出てくるんじゃね
量子コンピュータはどうなんだろうな……

520 :Socket774:2011/12/09(金) 04:01:21.34 ID:3Q4MIBDJ
>>514
IBM「電力効率が悪いからPOWER7はPOWER6よりクロック下げます」
という経緯も知らないニワカは黙ってろ

521 :Socket774:2011/12/09(金) 06:56:24.69 ID:Na8JAD0m
>>510
え?普通にアウトオブオーダ実行だろ?

522 :,,・´∀`・,,)っ-○○○:2011/12/09(金) 07:33:15.87 ID:HaOcUE8E
ああ、レジスタリネームが無いだけでOoOE自体はあるのね

523 :,,・´∀`・,,)っ-○○○:2011/12/09(金) 07:35:04.89 ID:HaOcUE8E
いや、例のプレフィックス命令の作用考えれば広義の「リネーム」はあるか

524 :Socket774:2011/12/09(金) 09:16:20.21 ID:vkP4u9nJ
1995年 SPARC64(無印) out of order
1995年 PentiumPro out of order

525 :Socket774:2011/12/09(金) 13:26:37.13 ID:zgcIhzKZ
普通に論理/物理レジスタ 32/64、OoO、SMTだ


526 :Socket774:2011/12/09(金) 15:33:41.83 ID:h+0V9M4A
>>508
ARMさんもA64で増やしたし
論理レジスタは32本がミニマムじゃないかな?

527 :Socket774:2011/12/09(金) 17:36:47.33 ID:n+x5si1T
>>505
シッタカの団子にそんな芸当はできないよ

528 :Socket774:2011/12/10(土) 00:58:37.09 ID:liiZowda
論理レジスタが少ないとレジスタの使いまわしや早いフェッチの機会が少なくなるため、
物理レジスタがいくらあっても性能向上の余地は限られる。

整数演算ではあまり差はつかないが、きっちりスケジューリングされた浮動小数点演算では差が大きい。


529 :Socket774:2011/12/10(土) 00:59:35.96 ID:liiZowda
団子の書き込みの半分くらいはデタラメだと思えばいいね。

530 :Socket774:2011/12/10(土) 01:18:22.16 ID:+2qEBKmT
「団子氏」って「団子虫」に似てるね
「団子厨」って団子虫からきたのか?

団子虫
団子無視

531 :Socket774:2011/12/10(土) 01:43:26.00 ID:metW1VQM
物理レジスタが多ければ大丈夫っていうのは
あくまで論理レジスタだけでspllingなしでプログラムが組める場合だよね

あとRSのエントリ数はCore2で32・SandyBridgeでも54で
これはレイテンシの大きいFPU命令やL2アクセスを隠蔽するには不十分
まだまだソフトウェアレベルのスケジューリングの比重は大きい

532 : 忍法帖【Lv=40,xxxPT】 :2011/12/10(土) 02:23:29.00 ID:C8DWaXpD
Haswellでもその辺の拡張は行ってくるだろうね
Core2→Nehalem→Sandyと各世代ごとで必ず強化されてる部分だしな

533 :Socket774:2011/12/10(土) 02:25:35.71 ID:PpnmWU9Y
>>529
実際7割はデタラメだな

534 :Socket774:2011/12/10(土) 02:43:17.19 ID:liiZowda
ソフトウェアパイプラインなんかは論理レジスタがたくさん必要だしね
あるいはIA-64みたいな支援が

535 :Socket774:2011/12/10(土) 04:57:01.03 ID:metW1VQM
OoOが優れているのはMemory Disambiguation等の投機的動作が可能なところで
静的には不可能ななアグレッシブなスケジューリングが可能になる

536 :,,・´∀`・,,)っ-○○○:2011/12/10(土) 11:58:54.72 ID:DK7iOzHK
> 論理レジスタが少ないとレジスタの使いまわしや早いフェッチの機会が少なくなるため、

うーん、それこそデタラメだな。
君はその一言をもって、俺の指摘してるレジスタリネームの存在を全く理解してない
無知蒙昧なちんけな存在だと自分で証明してしまった。

たとえばAVXにおける倍精度4x4行列積のループの内側はこうだ。

vbroadcastsd ymm0, [rcx]
vmulpd ymm0, ymm4
vaddpd ymm8, ymm0
vbroadcastsd ymm0, [rcx+256]
vmulpd ymm0, ymm5
vaddpd ymm9, ymm0
vbroadcastsd ymm0, [rcx+512]
vmulpd ymm0, ymm6
vaddpd ymm10, ymm0
vbroadcastsd ymm0, [rcx+768]
vmulpd ymm0, ymm7
vaddpd ymm11, ymm0

なぜymm0を使いまわしてるのか君には理解できないだろうけどこれはこれでいいんだよ。
この場合ymm0はload(vbroadcast)によって依存関係を断ち切ることができるので
別の物理レジスタを割り当てて、後続のvmulも含めてパイプラインで実行可能になる。
もちろんvaddは反復するのでレジスタリネームによる並列化がきかないので、
FP加算器のレイテンシはなるべく小さく(この場合4以下)デザインされてなければならない。

537 :Socket774:2011/12/10(土) 12:08:50.00 ID:r+smprMN
つまりレジスタリネームは万能じゃないってことでしょ?
デタラメじゃねーじゃんw

538 :Socket774:2011/12/10(土) 12:16:09.46 ID:Ays5e9k6
CPUのアーキテクチャがわかるレベルの人が読める本で
GPUのアーキテクチャがよくわかるおすすめの本ってないですか?
ハードの本でもプログラミングの本でもよいのだが。

539 :,,・´∀`・,,)っ-○○○:2011/12/10(土) 12:21:32.88 ID:DK7iOzHK
>>537
全然内容理解してないのな。

> 早いフェッチの機会が少なくなるため、

これがデタラメだって言ってるの。スケジューラのリソースのある限りいくらでも
レジスタ(この場合ymm0)を読み替えて先読みが可能。

ロード・ストアの帯域さえ十分なら、加算ユニットのレイテンシ×2+α程度のレジスタ本数があれば
実用上問題ないね。Sandy Bridgeはストアが狭い(Bulldozerはもっと狭い)からできるだけ
オンレジスタで処理したいが。
逆に論理レジスタが多いほどレジスタリネーム機構の実装コストは大きくなる。



単精度行列積の場合も書いておく。
AVXのYMMレジスタでは8x8単精度行列は8本のレジスタで表現できるけど、こればかりは
こればかりは論理レジスタ16本は少し苦しくなる。
加算用に8本、被乗数用に8本、乗数ロード+乗算用に最低1本でできれば17本以上は欲しい。
まあ入れ替えて処理するしかない。
加算用に8本、被乗数に7本、ロード+乗算に1本にして被乗数を入れ替えて処理すれば
Sandy Bridgeの持つLoad帯域的にはなんとか間に合う。

540 :Socket774:2011/12/10(土) 12:26:50.17 ID:SgeYfZrr
団子は日本語の理解力に少々難がある上に間違いを認めないから、何を突っ込んでも無駄w

541 :Socket774:2011/12/10(土) 12:27:37.51 ID:CiN3DMvv
なんだかよくわからんがその書き方だと、レジスタリネームとやらを廃してレジスタを倍にすれば良いんじゃねって
素人は思うよ

542 :,,・´∀`・,,)っ-○○○:2011/12/10(土) 12:27:46.83 ID:DK7iOzHK
↑と、日本語の読解力が無い馬鹿が言っております

543 :,,・´∀`・,,)っ-○○○:2011/12/10(土) 12:31:28.45 ID:DK7iOzHK
>>541
vbroadcastsd+vmulpdの合計レイテンシが何サイクルあるか調べておいで。
ついでにいうと論理レジスタを増やすと退避のオーバーヘッドが大きくなってマルチタスクに弱くなるよ

544 :Socket774:2011/12/10(土) 12:31:38.03 ID:Ays5e9k6
>>539
レジスタリネーミングではコンパイラがスタック領域に割り当てする部分は
マップできないよ。だからそこがネックになるってのが一般論。
現代のプロセッサでメモリリネーミングをサポートしているのは製品としてはないよ。
団子先生の説明はレジスターリネーミングの通常動作の説明をしているだけで
論点からははずれている。

545 :Socket774:2011/12/10(土) 12:34:56.43 ID:CiN3DMvv
>>542
だからトーシロだつってんだろが
まぁ団子の文もうちょっと読みやすければ真面目に読むが

読み返したら大方わかったがな
俺が思ったのはレジスタの本数よりその並列化できない処理のレイテンシとやらを必死こいて削った方が・・・

素人考えだが。

546 :,,・´∀`・,,)っ-○○○:2011/12/10(土) 12:35:51.90 ID:DK7iOzHK
> レジスタリネーミングではコンパイラがスタック領域に割り当てする部分は
> マップできないよ。だからそこがネックになるってのが一般論。
スタックに割り当てなきゃいけないほど変数使うコードって何があるんだよ?

547 :Socket774:2011/12/10(土) 12:36:31.01 ID:SgeYfZrr
顔真っ赤な団子ワロス

548 :,,・´∀`・,,)っ-○○○:2011/12/10(土) 12:38:59.98 ID:DK7iOzHK
そもそもVenusのアプローチは「逸般的」ですし。
32ビットの定数をレジスタにロードするのに2命令かかるような命令セットが
一般的なアプリケーションの実行に有用なわけがありえない。

549 :Socket774:2011/12/10(土) 12:43:47.07 ID:oM8nSmng
8では足りない
16でもやりくりすれば足りるが
24ぐらいはあった方が当然楽で
コンテキストスイッチのコストについては
数値演算では問題になることは少ないかなと。

550 :,,・´∀`・,,)っ-○○○:2011/12/10(土) 12:48:27.73 ID:DK7iOzHK
数値計算用プロセッサにおいて一番大事なのは市場で低コストで調達できること。
それ以外の用途で全く使えない代物を作っても結局高コストでは意味が無い。

551 :Socket774:2011/12/10(土) 15:59:14.64 ID:kGzQQxe5
論点がずれてるw

552 :Socket774:2011/12/10(土) 16:00:36.84 ID:QUG9OmcR
団子の常套手段です

553 :Socket774:2011/12/10(土) 16:12:55.85 ID:/Rt0/jy6
ところで単発IDの奴ってなんか意見ないの?

554 :,,・´∀`・,,)っ-○○○:2011/12/10(土) 16:46:57.56 ID:DK7iOzHK
SSEの16本に比べて多いという印象は無いけどな
むしろシフトみたいにSSEなら即値指定すればすむ命令もAltiVecではわざわざ
ビットパターンをレジスタにセットしておく必要があったり。

いまどきレジスタの数が性能の決め手だとかいう主張自体が時代錯誤。



一般論として論理レジスタが多いほどコード密度は下がる。
RISCは時間当たりの処理量を増やしてペイする設計だったが、200X年代初頭には
そのアプローチは既に破綻してた。
クライアントサイドJavaの実行パフォーマンスはハイエンドのSPARCですら
Celeron搭載のWindowsマシンに負けていた。

555 :,,・´∀`・,,)っ-○○○:2011/12/10(土) 16:52:14.15 ID:DK7iOzHK
>>551-552
論点ってなんだ?自分の読解力のなさを棚に上げるなよ。
レジスタだけ増やしただけの頭でっかちCPUなんてHPC以外では使えないって言ってるんだよ。

HPC以外で使えないことが、結果的に最先端プロセスルールでの製造単価を押し上げ
HPCですら居場所がなくなってきたのがベクトルプロセッサ衰退の歴史。
Venusはスカラベースでそれを再現しようとしてるにすぎない。

556 :Socket774:2011/12/10(土) 17:06:13.65 ID:cYTou5iw
何でファミコンやセガマークVは8bitCPUで発売しちゃったの?
当時既にPC用やゲーム機用の16bitCPUが出てたでしょ。

8bitCPUなんて先が見えてるし、
同じ仕様で長く売るゲーム機の性質を考えれば、
16bitCPUを採用した方が良かったと思う。

557 :Socket774:2011/12/10(土) 17:08:13.00 ID:DJ21u0YB
>>496から始まってるのに、なんでコストの話になってるんだよw 馬鹿すぎw
x86のコスパの良さの話をしてるわけじゃないからw


558 :,,・´∀`・,,)っ-○○○:2011/12/10(土) 17:11:38.22 ID:DK7iOzHK
> 後、今はx86CPUでコプロのx87など使わなく、FPU性能もSpecCPUベンチを
> 見る限りじゃ他アーキと遜色ないのに、「x86=FPU遅い」の扱いをされてるのは
> 何故?

これが的外れだって言ってるんだが?
理論性能あたりのGEMMの実行性能比はレジスタ128本のCell-SPUなんかよりNehalemのほうが高い。

559 :Socket774:2011/12/10(土) 17:24:42.53 ID:DJ21u0YB
なんで「理論性能あたりの実行性能比」を出してくるの?

560 :,,・´∀`・,,)っ-○○○:2011/12/10(土) 17:29:06.62 ID:DK7iOzHK
いや、既に単精度・倍精度ともに絶対性能でCore i7-2500>PowerXCell 8iだしw
32SPEのCellはお蔵入りになったし結局は採算性が命運を決めるんだよ。

たしかVenusよりもSandy Bridge-EPのほうがソケットあたりのFLOPS数は上だったはず(同じ8コア)

561 :Socket774:2011/12/10(土) 17:39:42.82 ID:DJ21u0YB
SandyEPのFLOPSが増えたのはAVXのおかげだろ?
HPC向けに特化されたプロセッサと比べればx86は余分な物にトランジスタ割きすぎで
x86がコスパで最高峰なのは賛成だが、トランジスタ効率で負けてる

だから特化させたKnights Cornerが投入されると思っているんだが


562 :,,・´∀`・,,)っ-○○○:2011/12/10(土) 17:51:02.48 ID:DK7iOzHK
> HPC向けに特化されたプロセッサと比べればx86は余分な物にトランジスタ割きすぎで
> x86がコスパで最高峰なのは賛成だが、トランジスタ効率で負けてる

同じような負け惜しみを前世紀末のRISC衰退期にも聞いた。

563 :Socket774:2011/12/10(土) 18:28:48.51 ID:cWOsrElB
>>556
カセットビジョンなんて4bitCPUだったんだぞ、あの当時では8bitCPUは必要十分だ。
究極の8bitCPUゲーム機のPCエンジンがその後に控えているし

564 :Socket774:2011/12/10(土) 18:46:15.78 ID:DayEWj5U
1982〜3年頃のトラ技の通販広告だとZ80が1000円未満なのに対し6809や8086は数千円、
68000やZ8000は数万円だったと記憶してる。
ボリュームカスタマーの調達価格は上記より遥かに安いのは当然だが、それでも小売で
一万円台のコンソールに当事の16bitCPUはコスト的に荷が重い。カスタムチップ用の
マクロセル商売が行われてたものが殆ど無かったってのも理由だろうけど

ぴゅう太に採用されたTMS99xxはパーツ屋の広告で見た記憶は無いな。コンパニオンチップで
ありMSXやセガSCにもさいようされたTMS9918(VDP)は見たけど。

565 :Socket774:2011/12/10(土) 18:56:25.85 ID:DayEWj5U
後は1980年前後の16bitCPU全般について(命令語長のコンパクト化に特化したISAである
8086を例外として)コードが肥大化しがちでROMカセットのコストが嵩むとか、(外部8bitバス
バージョンの石ならOKだが)周辺やメモリも16bitにする必要があってそれもコスト圧力になる。

566 :Socket774:2011/12/10(土) 19:01:30.93 ID:8XGosEEf
>>556
本体赤字で売ったらダメよ
ソニーのえらいさんもこう言ってる

久多良木
基本的には我々はハードウェアから限界利益をたたき出して、それを次に投資しているわけです。ソフトは1本約5000〜6000円ですが、みんながいつも年間で4〜5本買ってくれるわけではない。

そこから利益はとれるけど、年間ではすごい数字にはならない。その点ハードウェアの利益はすごくデカイ。
3万円のハードが年間2000万台出ると6000億円でしょ。末端で。6000億円で赤字出したら会社がつぶれますよね。

ということは、そこで利益をとって次の投資をしていかなければならないわけです。
半導体や部品を全部外から買うと、残るものはアセンブリだけですから、アセンブリだけなら日本よりも中国でつくったほうが安い。

そんなことをしていたら、ハードからは利益は出ない。うっかりするとハード1台売ると赤字が出る。

セガさんがそれで失敗した。PSはハードから黒字が出たわけですよ。我々はすべて中で設計して、中で付加価値を落としているから。
セガさんは日立やヤマハから買ってきて、何ら何まで外からとってきたから、苦しかったわけです。
メディアの人はそれがわからずに、「ゲーム機はハードで損してソフトで儲ける」とよく書く。
そんなこと私は1度も言ったことがないし、任天堂さんだってそんなこと言わないと思う。

567 :Socket774:2011/12/10(土) 19:03:34.74 ID:cYTou5iw
16bitCPU、16bit対応DRAM、16bitGPU、16bitSPU、24bitバス・・・
80年代に16bit機を出したら、安く抑えても販売価格が3万5000円を超えるかも。

568 :,,・´∀`・,,)っ-○○○:2011/12/10(土) 19:04:58.45 ID:DK7iOzHK
>>566
なにこの「お前が言うな」はwwww



京の何が駄目なのかはおごちゃんが2年も前に的確に指摘してるね
ttp://www.nurs.or.jp/~ogochan/essay/archives/2132

つか、コメント欄のこれが的確すぎる
> ついでに、米国はスパコンに年間1千億円以上つぎ込んでいるけど1品ものに1千億円もかけないとか、
> 勝ち目のないCPU事業から撤退の機会を逃した富士通は今後の技術競争で大きな遅れを取るだろうとか、
> 代替技術が多々あるのにそれに国費を投じないから全然育たないとか、
> あたりまで書いてもらえれば完璧かと思います。
> 2010/1/29 金曜日 22:15:53 | #11

569 :Socket774:2011/12/10(土) 19:08:25.54 ID:cYTou5iw
>>566
>半導体や部品を全部外から買うと、残るものはアセンブリだけですから、アセンブリだけなら日本よりも中国でつくったほうが安い。

>そんなことをしていたら、ハードからは利益は出ない。うっかりするとハード1台売ると赤字が出る。

任天堂だって、半導体や部品は外注だし、製造も最終組み立ても他社にやらせてるだろ。
任天堂とセガの違いって何?

570 :Socket774:2011/12/10(土) 19:14:51.89 ID:8XGosEEf
>>569
ゲーム機の売れる値段が大体決まって以上
高価な部品を使ったら赤字


571 :,,・´∀`・,,)っ-○○○:2011/12/10(土) 19:15:16.48 ID:DK7iOzHK
サターンはSH-2を1基だけ搭載予定だったのにPSが3D積むことがわかってから焦って2CPUに設計変更したからね。
DreamcastのSH-4は1プロセッサに戻している。

任天堂は64まではコストアップ要因だった光学ディスクドライブ搭載を見送った。

572 :Socket774:2011/12/10(土) 19:18:19.99 ID:cYTou5iw
>>570
低所得一般人は1万5000円以下、中所得層は2万5000円以下、
ゲームに理解がある家庭や平均よりも大目の所得があるところでも、
4万円以下にならないとゲーム機を購入しないが、
ゲームマニアやゲームオタクなら10万円以下なら買ってくれる。

573 :Socket774:2011/12/10(土) 19:21:56.81 ID:GP6lrb2P
>>572
その層は何人くらい居るの?

574 :,,・´∀`・,,)っ-○○○:2011/12/10(土) 19:28:03.28 ID:DK7iOzHK
いまどきのゲームの主要顧客って金にルーズで頭のネジの緩い20代女だと思ってるが

575 :Socket774:2011/12/10(土) 19:28:23.94 ID:+2qEBKmT
>>572
コアなファンがこぞってX68000を買っていたな

576 :Socket774:2011/12/10(土) 19:30:11.43 ID:8XGosEEf
>>574
どのゲームを想定してるんだ?
携帯あたりかね?

577 :,,・´∀`・,,)っ-○○○:2011/12/10(土) 19:35:13.11 ID:DK7iOzHK
携帯に限らずだけど、戦国BASARA(笑)以降、女性ターゲットの歴史物ゲームが増えたな
いまどきのアイテム課金ゲームに金落としてるのは大半は女だぜ

578 :Socket774:2011/12/10(土) 19:36:31.44 ID:liiZowda
おごちゃん()

579 :,,・´∀`・,,)っ-○○○:2011/12/10(土) 19:40:38.53 ID:DK7iOzHK
官僚の天下り先のITゼネコンに金垂れ流すための詭弁に耳を傾ける必要なんてなかった

580 :Socket774:2011/12/10(土) 19:56:16.00 ID:cYTou5iw
>>573
日本だけで、ゲーム機に10万円出せる人は200万人くらいかな?
海外は知らん。

今は不況が続いていて可処分所得が低下しているから、
昔よりは減っているだろうな。

>>575
ネオジオとX68000って、結局何台売れたの?

581 :Socket774:2011/12/10(土) 20:12:52.09 ID:liiZowda
信頼できるソースではないが、
X68k 12万台
ネオジオ 100万台
ってとこらしい
ネオジオCDは知らん

582 :Socket774:2011/12/10(土) 20:20:14.55 ID:cYTou5iw
>>581
ゲームに大金を出せる人口はだいたい100万ちょっと程度か。
こんな小さな市場ではサードもあまり参加してくれなさそうだしキツイね。

せめて、5万円以下に価格を落とさないと厳しいかな?

583 :Socket774:2011/12/10(土) 20:26:52.17 ID:liiZowda
ネオジオは息が長かったが、発売は1990年とバブルの頂点なんだよな
X68kは1987年

584 :Socket774:2011/12/10(土) 20:38:15.33 ID:cYTou5iw
しかもバブル当時は、ネットだの携帯だのPCだのに金を使わなくても生きていけたから、
その分ゲームに割けるお金はたくさんある。

585 :Socket774:2011/12/10(土) 20:51:55.33 ID:YkDzstFY
>>580
200万人だと、ゲーム以外に浮気もする人が入っている気がする。
他にどんな面白いものがあってもゲーム機に10万出す人は10万人くらいじゃないだろうか

586 :Socket774:2011/12/10(土) 21:05:24.03 ID:cYTou5iw
>>585
自宅でアーケード基盤を遊ぶ人、PCEのコア構想に最後まで付いていった人、
劣勢のセガの応援を最後までやめなかった人、
PCゲーの為にGPUを半年に一度買い替え、
PCを一年で買い換える人が居るから、
10万円のゲーム機を買う人はもっと多いだろうと思うが。

587 :,,・´∀`・,,)っ-○○○:2011/12/10(土) 21:05:44.06 ID:DK7iOzHK
PS3はあと5年売っても累積赤字は解消しないだろうし
製造原価5万オーバーのゲームハードは未来永劫ないだろう。

なんだかんだで携帯電話ってコンテンツホルダーには事業展開しやすいと思うよ。
ポストペイの決済システムが簡単に利用できるし。

588 :Socket774:2011/12/10(土) 21:05:55.63 ID:liiZowda
>>584
パソコン通信で電話代が月に数万円

589 :Socket774:2011/12/10(土) 21:14:25.43 ID:GP6lrb2P
>>586
そういうのは大体被ってるだろうな

590 :,,・´∀`・,,)っ-○○○:2011/12/10(土) 21:28:02.69 ID:DK7iOzHK
そもそも今の若い世代のホームエンターテイメントの中心ってテレビ・ビデオ・ステレオデッキじゃないから。
情報端末はPC、録画よりネット配信、音楽はiPodみたいな。
据え置きゲーム機ってそろそろ潮時じゃね?

591 :Socket774:2011/12/10(土) 21:43:20.51 ID:CiN3DMvv
>>590
据え置きゲームは確かにな

pcでFF13やりてー・・・

592 :Socket774:2011/12/10(土) 22:20:42.92 ID:MQojDygT
若者はPCすら持ってないような気も
家に一台くらいはあるだろうが


144 KB
■ このスレッドは過去ログ倉庫に格納されています

★スマホ版★ 掲示板に戻る 全部 前100 次100 最新50

read.cgi ver 05.04.00 2017/10/04 Walang Kapalit ★
FOX ★ DSO(Dynamic Shared Object)