Foren Aktuelles Erstellen Mitglieder Anmelden

Grafikunterschied - An die Experten

Benutzer, welche sich diesen Thread anschauen:

SirHorst schrieb:
RPS. schrieb:
Doch, man siehts auf jeden Fall, Pikmin 3 hat Effekte die hab ich bisher auf der 360 noch nie gesehen. Sonst fällt mir aber auch kein Spiel ein.

Was mir aufgefallen ist war, das ich bei allen next gen Konsolen gedacht habe "das könnte aber besser aussehen" etc. Bei den wiiu titeln die ich gespielt habe (mario 3d world, mario kart 8) kam mir der Gedanke keinen Moment. Mit der wiiu hat Nintendo anscheinend genau die Power die es braucht um deren spiele perfekt aussehen zu lassen. Ich wüsste wirklich nicht wie zb ein mario kart noch hübscher sein könnte. Die beiden Spiele haben mich, rein optisch, mehr in ihren Bann gezogen als irgendein next gen Spiel.

Zumindest bekommt HD den Nintendo-Titeln ganz gut. Plus ein paar nette Effekte. Mir erweckt sich der Eindruck, dass Nintendo nur die Power reingesteckt hat, damit ihre Spiele in HD laufen. Ansonsten kümmert sie das Grafikrennen ja recht wenig. Bisher waren es ja auch immer schöne Spiele. Deshalb, als Zweitkonsole ungeschlagen.
 
Ist nicht zwingend hUMA.
Das die XBox One das kann ist ja nix neues.

Mega texture bzw DX11.2

Eigtl wird der von der PS4 DX11.1+ genannt deshalb verwirrt mich der Typ. Dem sollte eigtl klar sein das es DX11.2 drauf hat.
 
Weiter geht's mit den Twitter Einträgen:

XBox One SOC has a CPU, GPU, and 15 special-purpose processors. Total of 47MB of storage on-chip. #HC25

Hot Chips: At 363mm2 with over 5b transistors the Xbox One SoC designed by Microsoft and AMD is a very complex SoC.

Audio offload processor in XBox One SoC are "completely designed by Microsoft" and have "more than a CPU core worth of processing" #HC25

XBox One CPU has eight "modified" AMD Jaguar x86-64 cores, in two clusters of four cores. Modifiations to memory sharing & bandwidth. #HC25
 
satzberger schrieb:
Weiter geht's mit den Twitter Einträgen:

XBox One SOC has a CPU, GPU, and 15 special-purpose processors. Total of 47MB of storage on-chip. #HC25

Hot Chips: At 363mm2 with over 5b transistors the Xbox One SoC designed by Microsoft and AMD is a very complex SoC.

Audio offload processor in XBox One SoC are "completely designed by Microsoft" and have "more than a CPU core worth of processing" #HC25

XBox One CPU has eight "modified" AMD Jaguar x86-64 cores, in two clusters of four cores. Modifiations to memory sharing & bandwidth. #HC25

Sollte das nicht in den One Thread?
ISt aber bis aufs erste nix wirklich neues.
 
.hack//Haseo schrieb:
satzberger schrieb:
Weiter geht's mit den Twitter Einträgen:

XBox One SOC has a CPU, GPU, and 15 special-purpose processors. Total of 47MB of storage on-chip. #HC25

Hot Chips: At 363mm2 with over 5b transistors the Xbox One SoC designed by Microsoft and AMD is a very complex SoC.

Audio offload processor in XBox One SoC are "completely designed by Microsoft" and have "more than a CPU core worth of processing" #HC25

XBox One CPU has eight "modified" AMD Jaguar x86-64 cores, in two clusters of four cores. Modifiations to memory sharing & bandwidth. #HC25

Sollte das nicht in den One Thread?
ISt aber bis aufs erste nix wirklich neues.

hast recht aber bei den ganzen threads kommt man schon durcheinander, ich poste mal
 
Hana-Bi schrieb:
like @hsafoundation

Und das Ziel der HSA Foundation ist eben hUMA voranzutreiben (zumindest das von AMD).

http://www.computerbase.de/news/2013-04/amd-huma-verbessert-kommunikation-zwischen-cpu-und-gpu/

hsa ist aber nicht huma. hsa ist quasi die basis, auf der huma basiert. wenn die x1 hsa-ähnliche strukturen hat, kann man damit noch nicht auf huma-fähigkeiten schließen.
 
.hack//Haseo schrieb:
Ist nicht zwingend hUMA.
Das die XBox One das kann ist ja nix neues.

Mega texture bzw DX11.2

Eigtl wird der von der PS4 DX11.1+ genannt deshalb verwirrt mich der Typ. Dem sollte eigtl klar sein das es DX11.2 drauf hat.

Jo, zwingend ist es nicht - hab mir nochmals die Infos zu hUma und die Voraussetzungen durchgelesen. Denke aber dass das auf ne ähnliche Lösung hindeutet.
 
Hana-Bi schrieb:
.hack//Haseo schrieb:
Ist nicht zwingend hUMA.
Das die XBox One das kann ist ja nix neues.

Mega texture bzw DX11.2

Eigtl wird der von der PS4 DX11.1+ genannt deshalb verwirrt mich der Typ. Dem sollte eigtl klar sein das es DX11.2 drauf hat.

Jo, zwingend ist es nicht - hab mir nochmals die Infos zu hUma und die Voraussetzungen durchgelesen. Denke aber dass das auf ne ähnliche Lösung hindeutet.

Man kann aber man weiß es nicht genau.
Von AMD wirst nix hören die dürfen nicht über Produkte ihrer Kunden reden.

Spätestens wenns soweit ist (entwickler es nutzen) hören wir ehw as Sache ist.
 
huma-diagram-640x344.jpg


Aber das wäre doch genau shared coherent memory , oder nicht?

hUMA is the way AMD proposes to solve this problem. With hUMA, the CPU and GPU share a single memory space. The GPU can directly access CPU memory addresses, allowing it to both read and write data that the CPU is also reading and writing.

hUMA is a cache coherent system, meaning that the CPU and GPU will always see a consistent view of data in memory. If one processor makes a change then the other processor will see that changed data, even if the old value was being cached.
 
mnk schrieb:
ja, klingt schon plausibel. ich frage mich nur immernoch, wie der esram da jetzt reinpasst.

Und wenn man den für genau diese aktion einfach mal sein lässt?
Ich hab keine ahnung was für ne Geschwindigkeit benötigt wird aber denke dann wär der RAM wieder zu langsam.

Evtl. kann mand en eSRAM auch zwischen klemmen? Ich hab keine ahnung.
Möglich sein sollte es im Grunde da dieselbe Hardware (fast) der einzige faktor in dem System der großartig ander ist sollte ja lediglich der eSRAM sein.
 
Hana-Bi schrieb:
huma-diagram-640x344.jpg


Aber das wäre doch genau shared coherent memory , oder nicht?

hUMA is the way AMD proposes to solve this problem. With hUMA, the CPU and GPU share a single memory space. The GPU can directly access CPU memory addresses, allowing it to both read and write data that the CPU is also reading and writing.

hUMA is a cache coherent system, meaning that the CPU and GPU will always see a consistent view of data in memory. If one processor makes a change then the other processor will see that changed data, even if the old value was being cached.

Ich glaub hUMA steht für mehr als nur geteilter Speicher, der gemeinsame Speicher ist nur ein Punkt von hUMA. Interessanter ist da glaube ich die zusammenarbeit und intelligente aufteilung des Speichers. Was aus der GPU (stark) und CPU (intelligent) einen gemeinsamen intelligenten und starken Arbeitscluster macht.

Siehe fettgedrucktes, der ist aber nicht alleine durch einen Gemeinsamen Speicher gegeben. Sie bedienen sich zwar beide am selben, heißt aber nicht, dass sie auch unbedingt wissen was der andere macht (das was hUMA erst ausmacht).
 
ich denke so 100% auflösen wird sich das ganze - wenn überhaupt - eh erst nach dem launch der konsolen. dann dürfen ein ein paar wissende menschen vielleicht freier sprechen.

ich hatte ja ehrlich gehofft, dass ms vielleicht mal etwas offener etwas zu den genauen specs sagt und nicht wieder nur "5bn transistors" und das auch noch vor fachpublikum.
 
mnk schrieb:
ich hatte ja ehrlich gehofft, dass ms vielleicht mal etwas offener etwas zu den genauen specs sagt und nicht wieder nur "5bn transistors" und das auch noch vor fachpublikum.

Machen sie nicht.
Sie wissen, dass sie die schwächere Hardware besitzen und wollen das nicht auch noch selbst aller Welt direkt in Form von genauen Specs auf die Nase binden.
 
Nachdem man derartige Diskussion aus dem anderen Threads verbannen möchte, um nicht auf den Nerven der XBone Käufer herumzutanzen ->

Trayal schrieb:
mnk schrieb:
Bullit3006 schrieb:
Nur mal so als Vergleich,zu wieviel GB/s Is denn die PS4 schätzungsweise fähig ?

ps4: 176 gb/s für die kompletten 8gb ram
x1: 204 gb/s für die 32mb esram, 68 gb/s für die 8gb ram

Schlagt euch diesen ominösen Wert des eSRAM aus dem Kopf.

Zur Veranschaulichung einfach diesen Beitrag hier lesen und nochmal überdenken, was man uns hier verkaufen wollte ->

Glod schrieb:
MachtAG schrieb:
Keine Ahnung aber vllt. haben sie beim fertigen Prozessor einfach gemerkt das er eben schreiben und lesen kann zur selben Zeit. Kann doch passieren, ich weiß leider nicht wie ein Chip gebaut wird oder geplant wird, aber ich weiß wenn ich ein Rezept für ein Gericht schreibe, kommt manchmal auch was anderes am Ende raus.

Ok, ich versuche mal, das zu erklären. Ich hoffe, ich kriege es einigermaßen verständlich hin.

Zunächst einmal muss man sagen, dass Hardware per se wirklich äußerst simpel ist. Das gilt nicht für die darin umgesetzten mathematischen Algorithmen (ich habe z.B. keinen Schimmer, was da in einer Grafikkarte letztendlich wirklich abläuft, da ich keine Ahnung von den Bildverarbeitungsalgorithmen habe, die da implementiert wurden), aber die reine Hardware mit ihren Elementen ist simpel.

Das gilt gerade insbesondere für RAM. Ein RAM ist einfach nur ein Riesenhaufen sogenannter Flipflops, in die man was schreiben und dann wieder lesen kann. Natürlich kann man damit auch eine Menge Schabernack treiben und viele lustige Möglichkeiten zusammenbauen. Man kann unterschiedliche Schreib-/Lese-Modi wie z.B. Single, Pipeline und Burst einbauen. Man kann Test-Modi nutzen. Es gibt Möglichkeiten, die Energiezufuhr zum RAM runterzufahren, um Strom zu sparen usw. usw. Und natürlich kann man RAMs intern auch beliebig komplex gestalten, mit Swap-Pages und hast du nicht gesehen.
Das ist alles eine Menge Fachchinesisch und im Grunde auch völlig uninteressant. Denn unterm Strich lässt sich jeder RAM auf das folgende Bild runterbrechen:

single-port-ram-vlog.GIF


Was du hier siehst, sind die Ein- und Ausgänge eines sogenannten Single-Ports-RAMs. Die Ports haben die folgende Bedeutung:

DATA[7:0] : Das ist der Dateneingang des RAMs in diesem Fall mit einer Breite von 8 Bit (Bit 7, Bit 6, Bit 5... Bit 0)

ADDR[5:0] : Das ist die Addresse, über die man dem RAM sagt, welche Stelle im RAM geschrieben oder gelesen werden soll. Die Adresse hier hat 6 Bit

WE : Über dieses Signal wird dem RAM gesagt, ob er Daten in den RAM schreiben oder vom RAM lesen soll. Das ist nur ein Bit. Hat es den Wert '1' schreibt man, hat es den Wert '0' liest man (kann auch andersrum sein).
Da der Schreib- und Lesezugriff auf den RAM nur über dieses Signal gesteuert wird und dieses Signal immer nur einen Wert haben kann, ist sichergestellt, dass man diesen RAM zu einem bestimmten Zeitpunkt immer nur lesen ODER schreiben kann. Das ist auch so gewollt, denn wenn man eine Adresse gleichzeitig schreibt und liest, kann man nie sicher sein, was man letztendlich gelesen hat und was danach im RAM steht.

CLK : Das ist einfach der Takt, der den RAM antreibt. Ohne den geht gar nix

Q[7:0] : Das ist der Datenausgang ebenfalls wieder mit einer Breite von 8 Bit. Im Falle eines Lesezugriffes erscheinen hier die Daten.

Wie gesagt: Das ist die Basisform eines RAMs. Egal, was der sonst noch bietet - diese Grundfunktionalität ist auf jeden Fall drin. Und wie ich schon erwähnt habe, kann man diesen RAM immer nur schreiben ODER lesen. Beides gleichzeitig ist nicht möglich.
Natürlich hat man aber sehr viele Szenarien, wo man gerne eine Adresse lesen und gleichzeitig eine andere schreiben möchte. Schon aus Geschwindigkeitsgründen ist das wünschenswert. Wie muss man das nun lösen? Ganz einfach. Man braucht dafür mindestens einen Dual-Port-RAM und der sieht dann schlicht und ergreifend so aus:

true_dpram_sclk_vhd.gif


Es ist alles zwei Mal da - unterteilt in Port A und Port B. Das ist der ganze Trick. Und anders ist das nicht machbar. Je nachdem, wieviele Operationen ich an einem RAM parallel machen möchte, brauche ich dafür entsprechend viele Ports. Wir haben hier im Design z.B. einen RAM, der hat einen Schreib- und 64-Leseports. Wir können da also in einem Schritt gleichzeitig 64 Werte auslesen. Ist alles machbar. Aber man braucht die Ports.

Und um jetzt den Bogen zu der MS-Aussage mit dem RAM zu schlagen: Bevor die den eSRAM eingebaut haben, haben sie natürlich die Datenblätter dazu gelesen. Und in jedem Datenblatt befindet sich so ein Bild, wie das, was ich oben eingefügt habe. Man kann anhand dieser Ports sofort erkennen, ob man einen RAM gleichzeitig schreiben und lesen kann, oder nicht. Man wird da später keine geheimen Supermodi finden. Ohne entsprechende Ports geht da nix. Und die kennt man, bevor man den RAM überhaupt ins Design einbaut.




Was die andere Sache mit den freien Slots betrifft, die ebenfalls aufkam:

Wie ich oben schon schrieb, ist der Takt der Motor des RAMs. Ein Taktsignal sieht so aus:

clock.gif


Es handelt sich einfach um ein Signal, welches in regelmäßigen Abständen seinen Zustand von '0' auf '1' und dann wieder zurück ändert. Den Übergang von '0' auf '1' nennt man eine steigende Taktflanke, den Übergang von '1' auf '0' eine fallende Taktflanke.
Der Takt steuert die Speicher im RAM. In den meisten Fällen ist es so, dass die Speicher bei jeder steigenden Taktflanke Daten lesen/schreiben können. Zu allen anderen Zeitpunkten passiert in den Speichern nichts. Diese Zeit ist dann dafür da, dass die Logik rechnen kann.
Die Anzahl der steigenden Taktflanken pro Sekunde ergibt also die maximal Geschwindigkeit mit der ein RAM arbeiten kann. Will man diese Geschwindigkeit erhöhen, muss man einen schnelleren Takt wählen. Beispiel:

Ein Design läuft mit einer Frequenz von 1 MHz. Das bedeutet, dass dieses Design in einer Sekunde 1 Mio steigende Taktflanken kriegt. Ein RAM kann pro Sekunde also theoretisch 1 Mio Mal geschrieben/gelesen werden. Mehr ist da nicht machbar. Das ist Physik.
Will man öfter auf den RAM schreiben, muss man die Taktfrequenz erhöhen. Stellt man z.B. 2 MHz ein, dann hat man pro Sekunde 2 Mio steigende Taktflanken, was natürlich ein ganzer Zacken mehr ist. Die heutigen Designs laufen mit vielen hundert MHz oder gar GHz, was hunderte Millionen oder gar Millarden von steigenden Taktflanken in einer Sekunde bedeutet. Ordentlich Bums auf dem RAM also.
Aber wie erwähnt: Der RAM kann nur zu jeder steigenden Flanke arbeiten und zu anderen Zeitpunkten ist das nicht möglich.

Jetzt mal zu den freien Slots. Auf meinem Bild da oben sehen wir 6 steigende Taktflanken, also 6 Zeitpunkte, zu denen man auf den RAM zugreifen kann. Nun ist es bei einem Programmablauf selten so, dass zu jedem möglichen Zeitpunkt auf den RAM zugegriffen wird. Da müssen intern Sachen berechnet werden, eine Komponente wartet auf Daten von einer anderen Komponente etc.
Sagen wir in unserem Beispiel schreibt ein Programm zu den Flanken 1, 2 und 5. Bei den anderen Flanken ist es beschäftigt.
Nun ist es natürlich möglich, dass ein anderes Programm genau die freien steigenden Flanken 3, 4 und 6 nutzt, um ebenfalls auf den RAM zugreifen zu können. Das ist alles machbar und im Grunde kein großer Deal. ABER es erhöht die Durchsatzrate des RAMs nicht. Denn egal, wieviele Programme auf den RAM zugreifen und freie Taktflanken dafür nutzen - sie ändern nichts an der Gesamtzahl an Taktflanken, die für den RAM zur Verfügung stehen. Diese Zahl bleibt fix und deswegen bleibt auch die Durchsatzrate des RAMs fix.

Ich bin mir nicht sicher, ob das jetzt alles verständlich war, aber ich hoffe, ich konnte einigermaßen gut erklären, warum beide Aussagen:

a) Wir haben zufällig festgestellt, dass man gleichzeitig lesen und schreiben kann
b) wir können durch die Nutzung freier Slots die Durchsatzrate dramatisch erhöhen

kompletter Bullshit sind und entweder völlig falsch übersetzt, aus dem Zusammenhang gerissen oder absolut dümmliches PR-Gelaber sind.




 
@trayal: ich weiß, dass die 204 gb/s beim esram eine total an den haaren herbeigezogene zahl ist. sieh es beschwichtigende art der kommunikation an. :)

die folien der hot chips gestern zeigen auf jeden fall, dass die ingenieure bei ms sich der schwächen ihres systems bewußt sind und versucht haben, durch spezielle chips ein paar der bremsen zu lösen.

interessant auch, dass die ps4 von der architektur her deutlich mehr auf gpgpu ausgerichtet ist. das könnte auf lange sicht für die ps4 ein weiterer vorteil sein, vor allem wenn sich gpgpu auch auf dem pc stärker durchsetzt.
 
Zurück
Oben