Foren Aktuelles Erstellen Mitglieder Anmelden

Allerlei Technikdiskussionen

Benutzer, welche sich diesen Thread anschauen:

Ja, natürlich ist es möglich, aber nicht durchgehend und nicht bei allen Szenarien.
Wenn du gleichzeitig Daten aus/von dem eSRAM und DRAm holen kannst, kannst du natürlich auch die volle kombinierte Bandbreite rausholen. Und um das Szenario möglichst oft zu erreichen, musst du als Programmierer optimieren, optimieren und nochmal optimieren. Alle Schreib- und Lesevorgänge so timen, dass man gleichzeitig beide Busse nutzen kann, während man sich ständig überlegt, was an welcher Stelle des Renderpfads die beste Nutzung für den eSRAM wäre. Und das widerspricht wohl der Philosophie, die nach dem Entwickler-Hassobjekt PS3 an oberster Stelle stand: eine schnell zu verstehende und nutzbare Konsole zu kreieren.

Aber selbst mit Optimierung schaffst du diese KOmbi-Übertragungsrate nicht mal annähernd immer. Wichtige, bandbreitenbelastende Vorgänge sind das Laden und Schreiben von Texturen, Meshes und anderen Daten, die durch ihre Größe eben nicht annähernd in den winzigen eSRAM passen. Killzone hat ja wenn ich mich richtig erinner, schon mal weit über 1 GB Texturen im RAM. Und in solchen Szenarien bremst eine Architektur, die auf einen eSRAM als konfigurierbaren Cache setzt, eben ganz schön ab.
 
@Hana-Bi

Ja und deshalb verstehe ich auch deine Antwort auf meinen Beitrag nicht. :D

Das von dir gepostete Bild samt der dazu gehörigen Präsentation ist nämlich ein einziger Konter auf Panellos Aussage, weshalb ich es auch als "lustig" bezeichnete, dass du es (zumindest kam es mir so vor) als Untermauerung gepostet hast, à la "Aber...Sony...Auch!"

Er drückte damit nämlich aus was wir hier und auch sonst der Großteil der anderen Stellen der Herangehensweise von Microsoft entgegen setzen: Diese beiden Zahlen sind nicht so einfach zu vergleichen, da der Kombinierte Wert ein sehr theoretischer Wert ist, der so in der Praxis kaum erzielt wird und zwar nur mit Müh und Not der Entwickler, die sich hinter diese komplexe Problemstellung zwengen und selbst dann nicht in jeder Situation.

Das sah das Architekten Team der PS4 genauso und entschied sich für den großen, schnellen Memorypool, als die praktisch bessere Lösung, statt die (offenbar auch kostengünstigere) Alternative des unzureichend schnellen Pools zu nehmen, dem man eine schnelle aber kleine (die nicht einmal 1% des Memorypools ausmacht und für gewisse Anwendungsgebiete daher nicht zu gebrauchen ist, wodurch man gezwungen ist erst recht wieder auf den langsamen, großen Pool zu setzen) on-chip Lösung zur Verfügung stellt, um die Geschwindigkeit wieder hochzubekommen.
Eine Alternative die im Grunde Microsofts Lösung stark ähnelt, nur mit dem Unterschied, dass damit eine noch wesentlich höhere, kombinierte Bandbreite in allen Bereichen erzielt worden wäre (88 GB/s vs 68 GB/s und 1000 GB/s vs 204 GB/s).

Das kommt aber nur wirklich heraus wenn man sich auf die gesamte Präsentation bezieht, sprich auf ihren vernetzten Inhalt und nicht nur ein, zwei Sätze wortwörtlich nimmt, die aber im Zusammenhang mit dem Rest stehen.

Ursprünglich gings dir aber sogar darum, dass Cerny dieselbe Addition wie Panello gebraucht hat. Das wiederum stimmt schlicht nicht, da es aus dem Kontext gerissen war, da Cerny die Addierung bei der Präsentation benutzt hat um auf den Trugschluss hinzuweisen, nicht aber um einen Vergleich in Bauernfänger-Manier herzustellen.
 
Wenn ich das richtig verstehe, wird der eSRAM der One eher der CPU zuspielen als der GPU, oder? Jedenfalls dürfte es bei 32MB nur wenige Einsatzgebiete der GPU geben, wo 32MB überhaupt ein gewisses Potential ausspielen können. :?
 
Zimtzicke schrieb:
Wenn ich das richtig verstehe, wird der eSRAM der One eher der CPU zuspielen als der GPU, oder? Jedenfalls dürfte es bei 32MB nur wenige Einsatzgebiete der GPU geben, wo 32MB überhaupt ein gewisses Potential ausspielen können. :?

Ob es hardwaretechnisch mehr einer Seite zugeordnet ist, weiß ich nicht.
Aber prinzipiell würd ich auch eher davon ausgehen, dass der eSRAM eher für CPU-Aufgaben genutzt wird. Da gibts wohl mehr Einsatzgebiete für extrem schnellen Zugriff mit kleinen Latenzen auf kleine Datenmengen.
Die GPU hat mehr mit riesigen Datenbrocken zu tun, da wären 32 MB oft wohl nur ein Tropfen auf den heißen Stein.
 
Zimtzicke schrieb:
Wenn ich das richtig verstehe, wird der eSRAM der One eher der CPU zuspielen als der GPU, oder? Jedenfalls dürfte es bei 32MB nur wenige Einsatzgebiete der GPU geben, wo 32MB überhaupt ein gewisses Potential ausspielen können. :?

Nein, der eSRAM ist der Companion des GPUs. Der CPU hat zwar auch Zugriff, aber keinen direkten (was wiederum schlecht für ihn ist, aufgrund entstehender Latenzen) wie es beim GPU der Fall ist, laut den geleakten Files und der Hot Chips. Anfangen kann man damit schon eine Menge (muss man sogar, da 68 GB/s auf den System Memory Pool für heutige Verhältnisse einfach unzureichend sind), aber da wären wir wieder beim Thema der Komplexität und somit beim Puzzlen.
 
Trayal schrieb:
Zimtzicke schrieb:
Wenn ich das richtig verstehe, wird der eSRAM der One eher der CPU zuspielen als der GPU, oder? Jedenfalls dürfte es bei 32MB nur wenige Einsatzgebiete der GPU geben, wo 32MB überhaupt ein gewisses Potential ausspielen können. :?

Nein, der eSRAM ist der Companion des GPUs. Der CPU hat zwar auch Zugriff, aber keinen direkten (was wiederum schlecht für ihn ist, aufgrund entstehender Latenzen) wie es beim GPU der Fall ist, laut den geleakten Files und der Hot Chips. Anfangen kann man damit schon eine Menge (muss man sogar, da 68 GB/s auf den System Memory Pool für heutige Verhältnisse einfach unzureichend sind), aber da wären wir wieder beim Thema der Komplexität und somit beim Puzzlen.

Nur um es zu verstehen, ganz simpel ausgedrückt...

Ein Killzone SF lädt sich einen 1GB-Brocken Texturen einfach in den RAM. Die One müsste über den eSRAM unheimlich oft und schnell (viel) kleinere Bröckchen hin und her schaufeln, um auf das gleiche Ergebnis zu kommen?
 
So rein theoretisch ja. Aber ich denke, das wäre die dümmste Lösung für das Problem. Der kleine eSRAM wird da eher für wesentlich kritischere Sachen genommen werden, während große Texturpakete u.ä. weiter über den DDR3 laufen.
 
Es werden ja nicht nur riesige Datenpakete hin und her geschaufelt, sondern auch volumsmäßig kleinere Rechenoperationen durchgeführt. Da moderne GPUs über sehr viele Rechenwerke verfügen, die allesamt parallel arbeiten und mit einem kontinuierlichen Datenstrom versorgt werden wollen, ist die Bandbreite ein entscheidender Faktor, damit es nicht zu einem Flaschenhals kommt, der einen eigentlich schnellen GPU ausbremsen würde.

Die Entwickler werden bei der One versuchen wohl alles was wirklich Bandbreiten sensitiv ist in kleinen Einheiten an den eSRAM zu verteilen, um sich so wenig wie möglich auf den DDR3 zu stützen, der wohl eher dazu dient den GPU mit voluminösen Daten zu füttern und selbst hier könnte der eSRAM theoretisch einschreiten und beim Laden von Texturen behilflich sein.
Mit seinen 32mb wird er nicht groß genug sein um einen vollen Frame in hoher Auflösung zu rendern, allerdings sehr wohl Teile daraus.

Stell dir den eSRAM einfach wie jeden anderen Speicher auch vor: Es ist ein Ablageort für GPU und CPU (im falle des eSRAM der X1 vor allem für den GPU), an dem Daten angehäuft werden können, bevor sie auf dem Bildschirm ausgegeben werden. Er tut exakt dasselbe wie jeder andere Speicher auch, nur dass er direkt am SoC sitzt (dadurch eigentlich einen Latenz Vorteil besitzt, der dem GPU aber eher recht egal ist und der CPU kann nur indirekt darauf zugreifen, wodurch erst recht wieder Latenz entsteht), sehr klein und sehr schnell ist. Das ist keine Secret Sauce oder derlei. Es gibt den Entwicklern eher die Möglichkeit in die Hand den langsamen DDR3 zu kompensieren und gleichzeitig eine Kopfnuss mit, da sie sich Möglichkeiten überlegen müssen, wie sie dies handeln können.
 
Trayal schrieb:
Es werden ja nicht nur riesige Datenpakete hin und her geschaufelt, sondern auch volumsmäßig kleinere Rechenoperationen durchgeführt. Da moderne GPUs über sehr viele Rechenwerke verfügen, die allesamt parallel arbeiten und mit einem kontinuierlichen Datenstrom versorgt werden wollen, ist die Bandbreite ein entscheidender Faktor, damit es nicht zu einem Flaschenhals kommt, der einen eigentlich schnellen GPU ausbremsen würde.

Man kann es also drehen und wenden wie man will, die GPU ist der der PS4 relativ deutlich unterlegen, die RAM-Geschichte kann maximal mit (viel) Aufwand kompensiert werden?
 
@Zimtzicke

Nachdem was wir bisher wissen ist der GPU die Achillesferse der X1, die vom GPU der PS4 in wirklich allen wichtigen Belangen ganz klar overpowered wird. Der um 6 % höhere Chiptakt stellt die einzige Ausnahme da. Dazu wird auch die komfortablere Speicherlösung geliefert.

Wenn man die nackten, technischen Fakten miteinander vergleicht, merkt man, dass Microsoft sehr viel Mühen in seine Multimedia/AV Lösung gesteckt hat (will die X1 ja keines Falls schlechtreden, da sie schon ein ziemlich tolles Stück Technik ist, overall gesehen), während Sony den Fokus frontal auf den GPU und eine möglichst komfortable Speicherlösung gesetzt hat, die den GPU in jeder Hinsicht begünstigt.

Im Grunde zwei unterschiedliche Visionen/Philosophien. Gibt Sony aber zumindest am Papier die höhere Gaming Performance.
 
Ist einfach nur ein einziger PR-Fail.
Entweder er hat gar nicht erst großartig nachgefragt, ist von einem genervten Techi kurz abgespeist worden oder die Stille Post + eine Portion PR Geblubber schlug hier zu. Anders kann ich mir diese Aussagen einfach nicht erklären. :lol:
 
Trayal schrieb:
Es werden ja nicht nur riesige Datenpakete hin und her geschaufelt, sondern auch volumsmäßig kleinere Rechenoperationen durchgeführt. Da moderne GPUs über sehr viele Rechenwerke verfügen, die allesamt parallel arbeiten und mit einem kontinuierlichen Datenstrom versorgt werden wollen, ist die Bandbreite ein entscheidender Faktor, damit es nicht zu einem Flaschenhals kommt, der einen eigentlich schnellen GPU ausbremsen würde.

Die Entwickler werden bei der One versuchen wohl alles was wirklich Bandbreiten sensitiv ist in kleinen Einheiten an den eSRAM zu verteilen, um sich so wenig wie möglich auf den DDR3 zu stützen, der wohl eher dazu dient den GPU mit voluminösen Daten zu füttern und selbst hier könnte der eSRAM theoretisch einschreiten und beim Laden von Texturen behilflich sein.
Mit seinen 32mb wird er nicht groß genug sein um einen vollen Frame in hoher Auflösung zu rendern, allerdings sehr wohl Teile daraus.

Stell dir den eSRAM einfach wie jeden anderen Speicher auch vor: Es ist ein Ablageort für GPU und CPU (im falle des eSRAM der X1 vor allem für den GPU), an dem Daten angehäuft werden können, bevor sie auf dem Bildschirm ausgegeben werden. Er tut exakt dasselbe wie jeder andere Speicher auch, nur dass er direkt am SoC sitzt (dadurch eigentlich einen Latenz Vorteil besitzt, der dem GPU aber eher recht egal ist und der CPU kann nur indirekt darauf zugreifen, wodurch erst recht wieder Latenz entsteht), sehr klein und sehr schnell ist. Das ist keine Secret Sauce oder derlei. Es gibt den Entwicklern eher die Möglichkeit in die Hand den langsamen DDR3 zu kompensieren und gleichzeitig eine Kopfnuss mit, da sie sich Möglichkeiten überlegen müssen, wie sie dies handeln können.

Was ich bei der ganzen Sache noch nicht verstehe, warum eSRAM und nicht wieder eDRAM?
Selbst die Bandbreite des 360-eDRAM schlägt mühelos alle GDDR5- und eSRAM-Bandbreiten. In der Mark Cerny - Präsentation war doch sogar von theoretisch 1000GB/s für heutiges eDRAM die Rede. Außerdem sollte dieser doch billiger sein (weniger Transistoren verbrauchen), was wiederum mehr Platz für die GPU gelassen hätte.
Also warum eSRAM und kein eDRAM?
Irgendwas anderes muss der ja noch bringen...


Trayal schrieb:
@Zimtzicke

Nachdem was wir bisher wissen ist der GPU die Achillesferse der X1, die vom GPU der PS4 in wirklich allen wichtigen Belangen ganz klar overpowered wird. Der um 6 % höhere Chiptakt stellt die einzige Ausnahme da. Dazu wird auch die komfortablere Speicherlösung geliefert.

Wenn man die nackten, technischen Fakten miteinander vergleicht, merkt man, dass Microsoft sehr viel Mühen in seine Multimedia/AV Lösung gesteckt hat (will die X1 ja keines Falls schlechtreden, da sie schon ein ziemlich tolles Stück Technik ist, overall gesehen), während Sony den Fokus frontal auf den GPU und eine möglichst komfortable Speicherlösung gesetzt hat, die den GPU in jeder Hinsicht begünstigt.

Im Grunde zwei unterschiedliche Visionen/Philosophien. Gibt Sony aber zumindest am Papier die höhere Gaming Performance.

Man muss ja fairerweise sagen, dass es ja eigentlich heißen müsste PS4 (bessere GPU, schnellere RAM, nur 4GB RAM) vs. Xbox One (langsamere GPU, langsamerer RAM, 8GB RAM).
Das waren ja die beiden Konzepte bis kurz vor Schluss (Multimedia vs. reine Spielekonsole). Sony hatte aber Glück und jetzt können sie das gleiche wie Microsoft machen (was sie auch tun: 3GB für OS reserviert, Sprachsteuerung, Cloud) und haben dazu noch die besser Gaming-Performance!
 
New Horizon schrieb:
Was ich bei der ganzen Sache noch nicht verstehe, warum eSRAM und nicht wieder eDRAM?
Selbst die Bandbreite des 360-eDRAM schlägt mühelos alle GDDR5- und eSRAM-Bandbreiten. In der Mark Cerny - Präsentation war doch sogar von theoretisch 1000GB/s für heutiges eDRAM die Rede. Außerdem sollte dieser doch billiger sein (weniger Transistoren verbrauchen), was wiederum mehr Platz für die GPU gelassen hätte.
Also warum eSRAM und kein eDRAM?
Irgendwas anderes muss der ja noch bringen...

Der vielleicht größte Unterschied ist die Art wie DRAM und SRAM (das "e" steht ja nur jeweils für "embedded) ihre Daten halten. Der DRAM muss regelmäßig aufgefrischt werden, während das beim SRAM nicht der Fall ist. Solange die Transistoren unter Strom stehen, halten sie die Daten. Lässt sich bereits vom Namen ableiten "Static random access memory" und "Dynamic random access memory".

SRAM benötigt mehr Platz als DRAM. Ein DRAM Modul derselben Größe kann glaub ich rund die 4-6x Kapazität eines SRAM Moduls haben. Dafür ist der SRAM idR aber schneller als der DRAM. Keine Ahnung ob da was dran ist, aber hab auch mal gelesen, dass der SRAM simpler sein soll, wodurch es den Leuten leichter fällt ein Interface zu kreieren, für den Speicherzugriff.

Ein Grund der aber wahrscheinlich Microsoft ganz besonders zum SRAM statt zum DRAM bewegt haben könnte (da er als embedded Version direkt am SoC sitzt) ist sein geringerer Stromverbrauch und damit auch seine geringere Wärmeentwicklung. SRAM wird ja gerne bei Prozessoren als Cache eingesetzt, da er eben weniger Wärme produziert, die wiederum abgeleitet werden muss.

Der billigere DRAM wird in der Branche ja bekanntlich als Hauptspeicher benutzt (DDR3 und der darauf basierende GDDR5 sind ja DRAM), während der teurere SRAM vor allem als Cache benutzt wird.


New Horizon schrieb:
Man muss ja fairerweise sagen, dass es ja eigentlich heißen müsste PS4 (bessere GPU, schnellere RAM, nur 4GB RAM) vs. Xbox One (langsamere GPU, langsamerer RAM, 8GB RAM).
Das waren ja die beiden Konzepte bis kurz vor Schluss (Multimedia vs. reine Spielekonsole). Sony hatte aber Glück und jetzt können sie das gleiche wie Microsoft machen (was sie auch tun: 3GB für OS reserviert, Sprachsteuerung, Cloud) und haben dazu noch die besser Gaming-Performance!

Jop, das war ja ua auch der große Clue. Cerny erwähnte das auch in der Präsentation, über die wir hier vorher diskutiert haben, dass er im frühen Stadion der PS4 von Entwicklern regelrecht ausgebuht wurde, wegen den 4 GB und Sony der Untergang der Playstation prophezeit wurde, wenn diese nur mit 4 GB auf den Markt kommen würde.

Insgesamt scheint man aber 0,5 GB mehr zur Verfügung zu haben, als bei der X1 (5,5 vs 5 GB). Mit der Möglichkeit, dass im Laufe der Zeit mehr freigegeben wird. Ich glaube persönlich zwar nicht so recht daran, aber Sony tat das bei der PS3 auch bereits, dass im Nachhinein RAM freigegeben wurde, nachdem das OS optimiert und final war.
 
Nur wegen der Wärmeentwicklung?
Klar Microsoft war es offensichtlich sehr wichtig, dass die Xbox One "flüsterleise" ist, damit man auch ungestört darauf fernsehen kann, aber deswegen mehr Kosten generieren und dazu noch Perfomance zu verlieren?
Hätte man nicht auch den eDRAM runtertackten können oder muss er den Takt der GPU haben? Man hätte ja nicht versuchen müssen gleich auf 1000GB/s zu kommen, aber alles wäre doch besser als die "lausigen" 109GB/s des eSRAMs.
Ich verstehe es nicht...


Mit dem 2. Absatz wollte ich nur sagen, dass Sony sich alle Türen offen halten will. Sollte das TV-Feature doch ein Erfolg werden, wird es die PS4 (auch ohne HDMI-In) auch können, sollte Microsoft die Xbox zu einem App-Center für das Wohnzimmer machen (für was sollten die 3GB sonst da sein), wird das die PS4 auch können und sollte Kinect 2.0 der Hit werden, so wird das die PS4 in ähnlicher Form auch können.
Wenn Sony nur auf klassiche Spiele setzen würde, würden sie sich anders verhalten...
 
Denke schon, dass das Thema Wärmeentwicklung ein sehr großes war. Geschwindigkeit + Energieverbrauch/Wärmeentwicklung prädestinieren den SRAM ja dazu ihn auf ein Die zum Prozessor zu packen - sieht ja die gesamte Industrie so, nicht nur Microsoft.

Wenn man sich Microsofts Öffentlichkeitsarbeit ansieht, dann war ihnen das Thema Energieverbrauch und Wärmeentwicklung offenbar sehr, sehr wichtig. Habens ja zu keiner Situation versäumt darauf hinzuweisen, dass die X1 leise, sehr stromsparend (100W SoC und 2,5 % Clock Gating) und auch noch erhöht ausfallssicher ist, durch den automatischen Under-Clock.
Energiesparen und Wärmeentwicklung war daher (und auch im Hinblick auf die RRoD Katastrophe der 360) mit Sicherheit ein sehr großes Thema, für die Architekten der X1.

Dass der eSRAM nicht schneller ist, liegt ua an Takt und Speicherinterface. Ein breites Speicherinterface würde wiederum seinen Platz auf dem SoC beanspruchen und das SoC der X1 ist ja bereits extrem komplex, wie wir von der Hot Chips wissen.
Man sollte den eSRAM einfach nicht als Secret Sauce betrachten, sondern als Unterstützung für den langsamen DDR3 Hauptspeicher. Zudem stellt sich die Frage ob es für den GPU der X1 nicht auch evtl völlig ausreichend ist?
MS Architekten werden den GPU nicht absichtlich durch eine zu geringe Speicherbandbreite "gebottlenecked" haben. Ich gehe eigentlich davon aus, dass die Speicherbandbreite ausreichend sein wird, für die Leistungsfähigkeit des GPU, wenn die Entwickler den eSRAM zu meistern lernen.

Insgesamt kann man aber auch vorsichtig behaupten, dass MS auf lange Sicht gesehen den kostengünstigeren Weg beschritten hat. DDR3 ist billig und der eSRAM wird im Preis mit zukünftigen Fertigungsprozessen wunderbar skalieren. Sony hingegen ist nun mit dem teuren GDDR5 verheiratet.
 
Zurück
Oben