Vergleich der Leistung von Gleitkommadivisionen und Multiplikationen
Einführung:
Im Bereich der Gleitkommaoperationen ist das Potenzial Leistungsunterschiede zwischen Division und Multiplikation wecken oft Neugier. Dieser Artikel soll Einblicke in dieses Thema geben und sich mit der Frage befassen, ob die Codierung mithilfe von Division oder Multiplikation Leistungsvorteile bringt.
überlegungen zur Leistung:
Traditionell wird Division bei Gleitkommaberechnungen verwendet wurde als langsamer als die Multiplikation angesehen. Moderne Prozessorarchitekturen bieten jedoch unterschiedliche Leistungsniveaus für diese Vorg?nge. Viele CPUs k?nnen Multiplikationen in nur 1 oder 2 Taktzyklen ausführen, w?hrend Divisionen normalerweise mehr Zyklen erfordern.
Divisionen k?nnen beispielsweise 24 Zyklen überschreiten, wie in einer Antwort zu diesem Thema hervorgehoben. Diese Diskrepanz ergibt sich aus der algorithmischen Natur dieser Operationen. Die Multiplikation kann in zahlreiche gleichzeitige Additionen zerlegt werden, w?hrend die Division eine iterative Subtraktion beinhaltet, ein weniger effizienter Prozess in der Hardware.
Auswirkungen der Codestruktur:
Bei der Analyse der Auswirkungen von Codestruktur zeigt das in Update 1 bereitgestellte Beispiel, dass die Division im Vergleich zur Multiplikation einen erheblichen Leistungsaufwand verursachen kann. Im Codeausschnitt:
float f1, f2 = 2 float f3 = 3; for( i =0 ; i < 1e8; i++) { f1 = (i * f2 + i / f3) * 0.5; //or divide by 2.0f, respectively }
Die Divisionsoperation innerhalb der Schleife (i/f3) tr?gt zur erh?hten Ausführungszeit bei. Eine Division durch 2,0f (Multiplikationsansatz) würde zu einer verbesserten Leistung führen.
Grundliegende Gründe für die Komplexit?t der Division:
Die architektonischen Anforderungen für die Division sind komplexer als für die Multiplikation. Bei der Division geht es darum, den Quotienten zweier Zahlen zu ermitteln, ein Vorgang, der kompliziertere Berechnungen erfordert. Um dies zu mildern, verwenden einige FP-Einheiten eine N?herungstechnik namens reziproke Multiplikation, die die Division auf Kosten der Genauigkeit etwas beschleunigt.
Schlussfolgerung:
W?hrend Gleitkomma Division kann auf modernen PC-Architekturen langsamer sein als Multiplikation. Die Leistungsunterschiede variieren je nach Prozessor und ausgeführter Codestruktur. Bei Anwendungen, bei denen die Leistung von entscheidender Bedeutung ist, kann die Entscheidung für Multiplikation statt Division einen leichten Vorteil bieten. Die relativen Auswirkungen dieser Vorg?nge auf die Leistung sollten jedoch im Kontext des gesamten Algorithmusdesigns bewertet werden.
Das obige ist der detaillierte Inhalt vonIst die Gleitkommamultiplikation immer schneller als die Division?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Hei?e KI -Werkzeuge

Undress AI Tool
Ausziehbilder kostenlos

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem v?llig kostenlosen KI-Gesichtstausch-Tool aus!

Hei?er Artikel

Hei?e Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Hei?e Themen

Menschen, die den Python -Transfer zu C studieren. Die direkteste Verwirrung ist: Warum k?nnen Sie nicht wie Python schreiben? Da C, obwohl die Syntax komplexer ist, zugrunde liegenden Kontrollfunktionen und Leistungsvorteile. 1. In Bezug auf die Syntaxstruktur verwendet C Curly -Klammern {} anstelle von Einrückungen, um Codebl?cke zu organisieren, und variable Typen müssen explizit deklariert werden; 2. In Bezug auf das Typensystem und die Speicherverwaltung verfügt C nicht über einen automatischen Mülleimermechanismus und muss den Speicher manuell verwalten und auf die Freigabe von Ressourcen achten. Die Raii -Technologie kann das Ressourcenmanagement unterstützen. 3. In Funktionen und Klassendefinitionen muss C explizit auf Modifikatoren, Konstrukteure und Zerst?rer zugreifen und erweiterte Funktionen wie die überlastung des Bedieners unterstützen. 4. In Bezug auf Standardbibliotheken bietet STL leistungsstarke Container und Algorithmen, muss sich jedoch an generische Programmierideen anpassen. 5

C DestructorsarespecialMemberFunctionsThatautomaticalReleaseresources whenanObjectoesoutofScopeorisDeleted.1) Sie k?nnen anhilfe von FileHandles, andnetworkConnections.2) Anf?nger-oftenneglectDestructorsfordynamicMememory, Führung, führend, führen

STD :: CHRONO wird in C verwendet, um die Zeit zu verarbeiten, einschlie?lich des Erhaltens der aktuellen Zeit, der Messung der Ausführungszeit, der Betriebszeit und -dauer und der Formatierungsanalysezeit. 1. Verwenden Sie std :: chrono :: system_clock :: Now (), um die aktuelle Zeit zu erhalten, die in eine lesbare Zeichenfolge konvertiert werden kann, aber die Systemuhr ist jedoch m?glicherweise nicht eint?nig. 2. Verwenden Sie STD :: Chrono :: Steady_clock, um die Ausführungszeit zu messen, um die Monotonie zu gew?hrleisten, und umwandeln Sie sie durch Duration_cast in Millisekunden, Sekunden und andere Einheiten; 3. Zeitpunkt (Time_Point) und Dauer (Dauer) k?nnen interoperabel sein, aber die Aufmerksamkeit der Einheitenkompatibilit?t und der Uhr -Epoche (Epoche) sollte beachtet werden.

C STL ist eine Reihe allgemeiner Vorlagenklassen und -funktionen, einschlie?lich Kernkomponenten wie Containern, Algorithmen und Iteratoren. Container wie Vektor, Liste, Karte und Set werden zum Speichern von Daten verwendet. Vektor unterstützt den Zufallszugriff, der für h?ufige Lektüre geeignet ist. Das Einfügen und L?schen von Listen ist effizient, wird jedoch langsam abgerufen. Karte und Set basieren auf roten und schwarzen B?umen, und die automatische Sortierung eignet sich für schnelle Suchanfragen. Algorithmen wie Sortieren, Finden, Kopieren, Transformationen und Anh?ufungen werden üblicherweise verwendet, um sie zu verk?rpern, und sie wirken auf den Iteratorbereich des Beh?lters. Der Iterator fungiert als Brücke, die Container mit Algorithmen verbindet, der den Durchgang unterstützt und auf Elemente zugreift. Andere Komponenten umfassen Funktionsobjekte, Adapter, Allokatoren, die zum Anpassen von Logik, ?nderungsverhalten und Speicherverwaltung verwendet werden. Stl vereinfacht c

OpenGL ist eine gute Wahl. Zun?chst müssen Sie eine Entwicklungsumgebung erstellen, GLFW oder SDL verwenden, um ein Fenster zu erstellen, den Funktionszeiger mit Glew oder Glad zu laden und die Kontextversion wie 3.3 korrekt festzulegen. Zweitens verstehen Sie das State Machine -Modell von OpenGL und beherrschen Sie den Kernzeichnungsvorgang: Erstellen und Kompilieren Sie Shader, Linkprogramme, laden Sie Vertex -Daten (VBO), konfigurieren Sie Attributzeiger (VAO) und rufen Sie Zeichnungsfunktionen auf. Darüber hinaus müssen Sie mit Debugging -Techniken vertraut sein, den Shader -Kompilierungs- und Programmverbindungsstatus überprüfen, das Vertex -Attribut -Array aktivieren, die Bildschirm -Clear -Farbe usw. festlegen usw. Empfohlene Lernressourcen umfassen Learnopengl, OpenGlredbook und YouTube -Tutorial -Serie. Master das oben

STL (Standard -Vorlagenbibliothek) ist ein wichtiger Bestandteil der C -Standardbibliothek, einschlie?lich drei Kernkomponenten: Container, Iterator und Algorithmus. 1. Container wie Vektor, MAP und SET werden zum Speichern von Daten verwendet. 2. Iteratoren werden verwendet, um auf Containerelemente zuzugreifen. 3.. Algorithmen wie Sortier und Finden werden zum Betrieb von Daten verwendet. Bei der Auswahl eines Containers ist der Vektor für dynamische Arrays geeignet. Die Liste eignet sich für h?ufige Einfügungen und L?schungen. Deque unterstützt den Doppel-Endvorgang, MAP/UNORDEDD_MAP wird für die Taste-Wertepaar-Suche verwendet, und eingestellt/unconded_set wird für die Deduktion verwendet. Bei Verwendung des Algorithmus sollte die Header -Datei enthalten sein, und Iteratoren und Lambda -Ausdrücke sollten kombiniert werden. Achten Sie darauf, Iteratoren für Fehler zu vermeiden, Iteratoren beim L?schen zu aktualisieren und M nicht zu ?ndern

Lernen Sie C Sie sollten beim Spielen von Spielen aus den folgenden Punkten beginnen: 1. Die grundlegende Grammatik beherrscht, müssen jedoch nicht tief in sie eingehen, den grundlegenden Inhalt der Definition von Variablen, Schleifen, Bedingungsbeurteilungen, Funktionen usw. beherrschen; 2. Konzentrieren Sie sich auf die Beherrschung der Verwendung von STL -Containern wie Vektor, Karte, Set, Warteschlange und Stapel; 3. Lernen Sie schnelle Eingangs- und Ausgangstechniken wie das Schlie?en von synchronen Streams oder mithilfe von scanf und printf; 4. Verwenden Sie Vorlagen und Makros, um das Schreiben von Code zu vereinfachen und die Effizienz zu verbessern. 5. Mit h?ufigen Details wie Grenzbedingungen und Initialisierungsfehlern vertraut.

In C werden CIN und Cout für Konsoleneingabe und -ausgabe verwendet. 1. Verwenden Sie Cout, um die Eingabe zu lesen, auf Typ -Matching -Probleme zu achten und die Begegnung mit R?umen zu beenden. 3.. Verwenden Sie GetLine (Cin, Str) beim Lesen von Zeichenfolgen, die R?ume enthalten. 4. Wenn Sie CIN und GetLine verwenden, müssen Sie die verbleibenden Zeichen im Puffer reinigen. 5. Wenn Sie falsch eingeben, müssen Sie Cin.Clear () und Cin.Ignore () anrufen, um mit Ausnahmestatus zu verhandeln. Beherrschen Sie diese wichtigen Punkte und schreiben Sie stabile Konsolenprogramme.
