數字開始慢慢爬出來....
雖然後藤老爹前幾天那樣寫,不過把GT200改成DX11的功夫可能還多過把ECC和倍精度從GF100的shader拿掉。
只是要怎麼強化又是個難搞的地方,於是第二種說法,也是一般比較支持的說法:
GF104的另一個可能的設定是2GPC x 8SM x 48sp,
也就是每個SM從2個16sp array增加成3個、texture unit的數量也跟著補強;當然這樣的話tessellator數量就從GF100減一半了。
> Eji大想表示的應該是384的sp數量沒錯吧?
> 如果是的話,那應該是4SM才對(2GPC x 4SM/GPC = 8SM)。
對啊我又搞錯了_A_ 2GPC x 4SM = 8SM total
糟糕,不小心把shady兄的comment刪掉了.....
我也覺得用GT200硬改DX11的說法不太合常理,
(這難度比DX10.0->10.1,大太多了)
而且GTX460的Die Size不小!
NV若在DX11搞這麼多不同架構的大晶片,太浪費研發資源.
沿用GPC架構增加每SM的SP數是比較合理的選擇.
理論上每個SM負擔的SP變多,Branch效率會稍微下降.
不過和SP增多帶來的額外性能還是值得的.
不過原生是384SP,卻只能拿出336SP.....
代表GF104良率還是和ATI有差距......
畢竟只小一點點的RV870,去年一開始就能提供完整的版本.
而類似規模的GF104使用同製程,又晚了這麼久,
竟然還要關閉SM才能供貨?
GPU的Cache佔面積的比例很低,
沒必要特別去移除,通常只是關掉.
我是覺得硬體上L2Cache應該沒改.
畢竟對手早就把DX11鋪貨到全產品線了,
Time to market才是NV最大的問題.
NV頂多是中低階產品的L2 Cache關閉部分或全關,
以提升良率,降低單位成本.
Tex unit數.....
如果真的變成2GPCx4SMx48個SP,
那麼每SM的Tex unit數可能需要提升到6組,
也就是GTX460要有48個原生TEX單位,
才能維持GF100相同的ALU:TEx的比例.
所以GF104最可能的規格是
2GPC x 4SM (沿用GF100架構)
每SM擴增為48SP,總SP數384,
Tex unit數也相對應的提升到48Tex
這樣Die Size最少要400mm2,
可以切出的die會比RV870少20%.
良率也會比較低,耗電量應該會超過200W
所以關閉一組SM,而且可能關閉L2 Cache.
以讓良率拉高,最大耗電量壓低到200W以內
(使用雙6PIN外接電源)
因為架構上沒有明顯大改,但是SP數只有70%
性能大概會明顯低於5870.
可以預期這種GF104性能大致上類似5830,
部分情形下類似5850.
我的回复一直被这站的过滤系统挡掉 不知这个能不能看见 这样子就无法参与讨论了TAT
384SP的版本不出货 应该不是良率问题,而是怕会影响到465的清理库存
毕竟AMD那边的出货量来看 TSMC在40nm良率上有很大进步
Die Size现在还不知道 但如果瞄着RV870竞争,还要打价格战的话,应该不会拿出比300mm还大的晶片来吧
>>应该不会拿出比300mm还大的晶片来吧
基本上如果做384SP的話,是一定超過300mm2啦
(因為GF100砍一半成256SP就至少要260mm2以上)
如果不砍規格功能,400mm2上下是可以預期的.
目前流傳的die也的確很大顆,只是不知確實的尺寸.
如果硬要壓在300mm2以下,那就只能做原生256SP的.
以SM為比較基準,
沒想到最後不只TA、TF增為原來的2倍,
連SFU也是從4個變為8個,
而Texture L1 Cache也是2倍,
從12KB變24KB,
然而3組CUDA Core x 16,
只有一組有倍精度運算,
其餘沒啥改變。
沒想到NV最後是用刪除倍精度來換取Cache,
只不過以此方式減少die真的行嗎?
只能說:「真有你的,NV!」XDXDXD
對了,
差點忘了wrap dispatch也是從2個變4個。
GF104的GTX460不是出來了嗎?
怎麼還在發表在即???
難道現在市面上的GTX460不是用GF104???
為什麼網上的消息都說GTX460就是GF104,
還是現在那些都只是用gf100改的??
不然怎麼各位高手還在臆測呢?
因為這篇文章的日期(7/9)嘍....
現在當然是已經發表...._A_)a
to SSS兄:
奇怪,我貝氏過濾關掉了....
難道是被Akismet擋掉嗎。





