


Wie kann ich meine zahlentheoretische Transformation (NTT) und meine modulare Arithmetik für schnellere Berechnungen optimieren, insbesondere bei sehr gro?en Zahlen (z. B. über 12000 Bit)?
Dec 16, 2024 am 03:13 AMModulare Arithmetik und NTT-Optimierungen (Finite Field DFT)
Problemstellung
Ich wollte NTT schnell nutzen Quadrieren (siehe Schnelle Bignum-Quadratberechnung), aber das Ergebnis ist selbst für wirklich gro?e Zahlen langsam .. mehr als 12000 Bits.
Meine Frage lautet also:
< ;ol>
Dies ist mein (bereits optimierter) Quellcode in C für NTT (er ist vollst?ndig und Funktioniert zu 100 % in C, ohne dass Bibliotheken von Drittanbietern erforderlich sind, und sollte auch threadsicher sein. Beachten Sie, dass das Quellarray nur tempor?r verwendet wird!!! Au?erdem kann es das Array nicht in sich selbst umwandeln.
p>
Optimierte L?sung
- Verwendung vorberechneter Potenzen: Vorberechnen und speichern Sie die Potenzen von W und iW (die Urwurzel der Einheit und ihre Umkehrung), um eine Neuberechnung w?hrend des NTT-Prozesses zu vermeiden. Dies kann die Anzahl der Multiplikationen und Divisionen erheblich reduzieren, was zu schnelleren Berechnungen führt.
- Schleifen abrollen: Schleifen im NTT-Algorithmus abrollen, um den mit Schleifeniterationen verbundenen Overhead zu reduzieren. Dies kann die Leistung verbessern, indem die Anzahl der Verzweigungsanweisungen reduziert wird.
- Optimierung der modularen Arithmetik: Verwenden Sie bitweise Operationen und Assemblersprache, um modulare arithmetische Operationen (Addition, Subtraktion, Multiplikation und Potenzierung) effizient zu implementieren . Dadurch k?nnen unn?tige Verzweigungen und bedingte Anweisungen vermieden werden, was zu einer schnelleren Ausführung führt.
Beispielimplementierung
Hier ist ein Beispiel einer optimierten NTT-Implementierung in C unter Verwendung vorberechneter Potenzen und bitweiser Operationen:
class NTT { public: NTT() { // Initialize constants p = 0xc0000001; W = modpow(2, 0x30000000 / n); iW = modpow(2, p - 1 - 0x30000000 / n); rN = modpow(n, p - 2); NN = n >> 1; // Precompute W and iW powers WW = new uint32_t[n]; iWW = new uint32_t[n]; WW[0] = 1; iWW[0] = 1; for (uint32_t i = 1; i < n; i++) { WW[i] = modmul(WW[i - 1], W); iWW[i] = modmul(iWW[i - 1], iW); } } void NTT(uint32_t *dst, uint32_t *src, uint32_t n) { if (n > 0) { // Reorder even, odd elements for (uint32_t i = 0, j = 0; i < NN; i++, j += 2) { dst[i] = src[j]; } for (j = 1; i < n; i++, j += 2) { dst[i] = src[j]; } // Recursive NTT NTT(src, dst, NN); // Even NTT(src + NN, dst + NN, NN); // Odd // Restore results for (uint32_t i = 0, j = NN; i < NN; i++, j++) { uint32_t a0 = src[i]; uint32_t a1 = modmul(src[j], WW[i]); dst[i] = modadd(a0, a1); dst[j] = modsub(a0, a1); } } } private: uint32_t p, n, NN, W, iW, rN; uint32_t *WW, *iWW; // Modular arithmetic operations inline uint32_t modadd(uint32_t a, uint32_t b) { uint32_t d = a + b; if (d >= p) d -= p; return d; } inline uint32_t modsub(uint32_t a, uint32_t b) { uint32_t d = a - b; if (d > a) d += p; return d; } inline uint32_t modmul(uint32_t a, uint32_t b) { uint32_t m = (uint64_t)a * b; return m - (p * (m / p)); } inline uint32_t modpow(uint32_t a, uint32_t b) { if (b == 0) return 1; uint32_t t = modpow(a, b / 2); t = modmul(t, t); if (b & 1) t = modmul(t, a); return t; } };
Zus?tzliche Tipps
- Verwenden Sie eine h?here Ebene Sprache, die bitweise Operationen und Inline-Assembly unterstützt, wie z. B. C.
- Verwenden Sie einen Profiler, um die Engp?sse in Ihrem Code zu identifizieren und sie für die Optimierung auszuw?hlen.
- Erw?gen Sie die Parallelisierung des NTT-Algorithmus mithilfe mehrerer Threads oder SIMD-Anweisungen.
Das obige ist der detaillierte Inhalt vonWie kann ich meine zahlentheoretische Transformation (NTT) und meine modulare Arithmetik für schnellere Berechnungen optimieren, insbesondere bei sehr gro?en Zahlen (z. B. über 12000 Bit)?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Hei?e KI -Werkzeuge

Undress AI Tool
Ausziehbilder kostenlos

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem v?llig kostenlosen KI-Gesichtstausch-Tool aus!

Hei?er Artikel

Hei?e Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

STD :: CHRONO wird in C verwendet, um die Zeit zu verarbeiten, einschlie?lich des Erhaltens der aktuellen Zeit, der Messung der Ausführungszeit, der Betriebszeit und -dauer und der Formatierungsanalysezeit. 1. Verwenden Sie std :: chrono :: system_clock :: Now (), um die aktuelle Zeit zu erhalten, die in eine lesbare Zeichenfolge konvertiert werden kann, aber die Systemuhr ist jedoch m?glicherweise nicht eint?nig. 2. Verwenden Sie STD :: Chrono :: Steady_clock, um die Ausführungszeit zu messen, um die Monotonie zu gew?hrleisten, und umwandeln Sie sie durch Duration_cast in Millisekunden, Sekunden und andere Einheiten; 3. Zeitpunkt (Time_Point) und Dauer (Dauer) k?nnen interoperabel sein, aber die Aufmerksamkeit der Einheitenkompatibilit?t und der Uhr -Epoche (Epoche) sollte beachtet werden.

Es gibt haupts?chlich die folgenden Methoden, um Stapelspuren in C: 1 zu erhalten. Verwenden Sie Backtrace- und Backtrace_Symbols -Funktionen auf der Linux -Plattform. Durch Einbeziehung des Anrufstapels und der Drucksymbolinformationen muss der Parameter -rdynamische Parameter beim Kompilieren hinzugefügt werden. 2. Verwenden Sie CapturestackbackTrace -Funktion auf der Windows -Plattform, und Sie müssen dbgHelp.lib verknüpfen und sich auf die PDB -Datei verlassen, um den Funktionsnamen zu analysieren. 3.. Verwenden Sie Bibliotheken von Drittanbietern wie GoogleBreakpad oder Boost.Stacktrace, um die Operationen der Stack-Erfassungen plattformübergreifend zu plattformieren und zu vereinfachen. 4. Kombinieren Sie in Ausnahmebehandlung die oben genannten Methoden, um die Informationen zur automatischen Ausgabe von Stapelinformationen in Fangbl?cken auszuführen

In C bezieht sich der Typ Pod (PlainoldData) auf einen Typ mit einer einfachen Struktur und kompatibel mit C -Sprachdatenverarbeitung. Es muss zwei Bedingungen erfüllen: Es verfügt über eine gew?hnliche Kopiensemantik, die von memcpy kopiert werden kann; Es hat ein Standardlayout und die Speicherstruktur ist vorhersehbar. Zu den spezifischen Anforderungen geh?ren: Alle nicht statischen Mitglieder sind ?ffentlich, keine benutzerdefinierten Konstrukteure oder Zerst?rer, keine virtuellen Funktionen oder Basisklassen, und alle nicht statischen Mitglieder selbst sind Schoten. Zum Beispiel strukturpoint {intx; inty;} ist Pod. Zu den Verwendungen geh?ren bin?re E/A, C -Interoperabilit?t, Leistungsoptimierung usw. Sie k?nnen prüfen, ob der Typ Pod über std :: is_pod ist, es wird jedoch empfohlen, STD :: IS_TRIVIA nach C 11 zu verwenden.

Um den Python -Code in C aufzurufen, müssen Sie zuerst den Interpreter initialisieren und dann die Interaktion erreichen, indem Sie Zeichenfolgen, Dateien oder aufrufen oder bestimmte Funktionen aufrufen. 1. Initialisieren Sie den Interpreter mit py_initialize () und schlie?en Sie ihn mit py_finalize (); 2. Führen Sie den String -Code oder pyrun_simpleFile mit pyrun_simpleFile aus; 3.. Importieren Sie Module über pyimport_importmodule, erhalten Sie die Funktion über PyObject_getAttrstring, konstruieren

In C gibt es drei Hauptmethoden, um Funktionen als Parameter zu übergeben: Verwenden von Funktionszeigern, STD :: Funktions- und Lambda -Ausdrücken sowie Vorlagengenerika. 1. Funktionszeiger sind die grundlegendste Methode, geeignet für einfache Szenarien oder C -Schnittstelle kompatibel, aber schlechte Lesbarkeit; 2. Std :: Funktion in Kombination mit Lambda-Ausdrücken ist eine empfohlene Methode im modernen C, die eine Vielzahl von Callable-Objekten unterstützt und Typ-Safe ist. 3. Die Vorlagen -Generikummethoden sind die flexibelsten und für Bibliothekscode oder allgemeinen Logik geeignet, k?nnen jedoch die Kompilierungszeit und das Codevolumen erh?hen. Lambdas, die den Kontext erfassen, müssen durch std :: function oder template übergeben werden und k?nnen nicht direkt in Funktionszeiger konvertiert werden.

ANullPointerinc isaspecialValueInDicatingThatapoInterdoesNotPointToanyvalidmemoryLocation, AnditisusedtoSafelyManageandCheckpointersbefordereferencent.1.Beforec 11.0ornUllWaSused, ButnownullpreferredforclarityTypesafety.2.2.2.2.2.2.2.2.2.2.2.2.2.2.2.2.2.2.2.2.2.2.2.2.2.2.2.2.2.

STD :: MOVE MOVE MOVESS WIRD ALLES, sondern umwandelt das Objekt nur in eine RValue -Referenz und teilt dem Compiler mit, dass das Objekt für einen Umzugsvorgang verwendet werden kann. Wenn beispielsweise String -Zuordnung die Verschiebung der Semantik unterstützt, kann das Zielobjekt die Quellobjektressource ohne Kopieren übernehmen. Sollte in Szenarien verwendet werden, in denen Ressourcen übertragen und leistungsempfindlich werden müssen, z. B. die Rückgabe lokaler Objekte, Einfügen von Containern oder das Austausch von Eigentum. Es sollte jedoch nicht missbraucht werden, da es ohne sich bewegende Struktur in eine Kopie entartet und der ursprüngliche Objektstatus nach der Bewegung nicht angegeben ist. Angemessene Verwendung beim übergeben oder Rückgeben eines Objekts kann unn?tige Kopien vermeiden. Wenn die Funktion jedoch eine lokale Variable zurückgibt, kann bereits eine RVO -Optimierung auftreten. Hinzufügen von STD :: MOVE kann die Optimierung beeinflussen. Zu den Fehlern geh?ren Missbrauch gegen Objekte, die noch verwendet werden müssen, unn?tige Bewegungen und nicht bewegbare Typen

Der Schlüssel zu einer abstrakten Klasse ist, dass sie mindestens eine reine virtuelle Funktion enth?lt. Wenn in der Klasse eine reine virtuelle Funktion deklariert wird (z. B. virtualvoiddosomething () = 0;), wird die Klasse zu einer abstrakten Klasse und kann das Objekt nicht direkt instanziieren, aber Polymorphismus kann durch Zeiger oder Referenzen realisiert werden. Wenn die abgeleitete Klasse nicht alle reinen virtuellen Funktionen implementiert, bleibt sie auch eine abstrakte Klasse. Abstrakte Klassen werden h?ufig verwendet, um Schnittstellen oder gemeinsame Verhaltensweisen zu definieren, z. B. Formklassen in Zeichnen von Anwendungen und die Implementierung der DRAG () -Methode durch abgeleitete Klassen wie Kreis und Rechteck. Zu den Szenarien, die abstrakte Klassen verwenden, geh?ren: Entwerfen von Basisklassen, die nicht direkt instanziiert werden sollten, wobei mehrere verwandte Klassen dazu gezwungen werden, einer einheitlichen Schnittstelle zu folgen, ein Standardverhalten bereitzustellen und Unterklassen zu erfüllen, um Details zu erg?nzen. Zus?tzlich c
