


Bagaimanakah saya boleh mengoptimumkan Transformasi Teori Nombor (NTT) dan aritmetik modular saya untuk pengiraan yang lebih pantas, terutamanya dengan nombor yang sangat besar (cth., melebihi 12000 bit)?
Dec 16, 2024 am 03:13 AMAritmetik modular dan pengoptimuman NTT (medan terhingga DFT)
Pernyataan Masalah
Saya mahu menggunakan NTT dengan pantas kuasa dua (lihat pengiraan kuasa dua besar bignum cepat), tetapi hasilnya adalah perlahan walaupun untuk nombor yang sangat besar .. lebih daripada 12000 bit.
Jadi soalan saya ialah:
- Adakah terdapat cara untuk mengoptimumkan transformasi NTT saya? Saya tidak bermaksud untuk mempercepatkannya dengan selari (benang); ini adalah lapisan aras rendah sahaja.
- Adakah terdapat cara untuk mempercepatkan aritmetik modular saya?
Ini adalah kod sumber saya (sudah dioptimumkan) dalam C untuk NTT (ia lengkap dan 100% berfungsi dalam C tanpa memerlukan sebarang lib pihak ketiga dan juga harus selamat untuk benang. Berhati-hati susunan sumber digunakan sebagai sementara!!!, Juga ia tidak boleh mengubah tatasusunan kepada dirinya sendiri).
Penyelesaian Dioptimumkan
- Menggunakan Prakiraan Kuasa: Prakira dan simpan kuasa W dan iW (akar primitif perpaduan dan songsangnya) untuk mengelakkan pengiraan semula semasa proses NTT. Ini boleh mengurangkan bilangan pendaraban dan pembahagian dengan ketara, yang membawa kepada pengiraan yang lebih pantas.
- Membuka Gelung: Buka gulungan dalam algoritma NTT untuk mengurangkan overhed yang dikaitkan dengan lelaran gelung. Ini boleh meningkatkan prestasi dengan mengurangkan bilangan arahan cawangan.
- Mengoptimumkan Aritmetik Modular: Gunakan operasi bitwise dan bahasa himpunan untuk melaksanakan operasi aritmetik modular (tambah, tolak, darab dan eksponen) dengan cekap . Ini boleh menghapuskan pernyataan bercabang dan bersyarat yang tidak diperlukan, menghasilkan pelaksanaan yang lebih pantas.
Contoh Pelaksanaan
Berikut ialah contoh pelaksanaan NTT yang dioptimumkan dalam C menggunakan kuasa prapengiraan dan operasi bitwise:
class NTT { public: NTT() { // Initialize constants p = 0xc0000001; W = modpow(2, 0x30000000 / n); iW = modpow(2, p - 1 - 0x30000000 / n); rN = modpow(n, p - 2); NN = n >> 1; // Precompute W and iW powers WW = new uint32_t[n]; iWW = new uint32_t[n]; WW[0] = 1; iWW[0] = 1; for (uint32_t i = 1; i < n; i++) { WW[i] = modmul(WW[i - 1], W); iWW[i] = modmul(iWW[i - 1], iW); } } void NTT(uint32_t *dst, uint32_t *src, uint32_t n) { if (n > 0) { // Reorder even, odd elements for (uint32_t i = 0, j = 0; i < NN; i++, j += 2) { dst[i] = src[j]; } for (j = 1; i < n; i++, j += 2) { dst[i] = src[j]; } // Recursive NTT NTT(src, dst, NN); // Even NTT(src + NN, dst + NN, NN); // Odd // Restore results for (uint32_t i = 0, j = NN; i < NN; i++, j++) { uint32_t a0 = src[i]; uint32_t a1 = modmul(src[j], WW[i]); dst[i] = modadd(a0, a1); dst[j] = modsub(a0, a1); } } } private: uint32_t p, n, NN, W, iW, rN; uint32_t *WW, *iWW; // Modular arithmetic operations inline uint32_t modadd(uint32_t a, uint32_t b) { uint32_t d = a + b; if (d >= p) d -= p; return d; } inline uint32_t modsub(uint32_t a, uint32_t b) { uint32_t d = a - b; if (d > a) d += p; return d; } inline uint32_t modmul(uint32_t a, uint32_t b) { uint32_t m = (uint64_t)a * b; return m - (p * (m / p)); } inline uint32_t modpow(uint32_t a, uint32_t b) { if (b == 0) return 1; uint32_t t = modpow(a, b / 2); t = modmul(t, t); if (b & 1) t = modmul(t, a); return t; } };
Tambahan Petua
- Gunakan bahasa peringkat lebih tinggi yang menyokong operasi bitwise dan pemasangan sebaris, seperti C .
- Gunakan profiler untuk mengenal pasti kesesakan dalam kod anda dan menyasarkannya untuk pengoptimuman.
- Pertimbangkan untuk menyelaraskan algoritma NTT menggunakan berbilang urutan atau arahan SIMD.
Atas ialah kandungan terperinci Bagaimanakah saya boleh mengoptimumkan Transformasi Teori Nombor (NTT) dan aritmetik modular saya untuk pengiraan yang lebih pantas, terutamanya dengan nombor yang sangat besar (cth., melebihi 12000 bit)?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undress AI Tool
Gambar buka pakaian secara percuma

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Ya, kelebihan fungsi adalah bentuk polimorfik dalam C, khususnya polimorfisme kompilasi masa. 1. Kelebihan fungsi membolehkan pelbagai fungsi dengan nama yang sama tetapi senarai parameter yang berbeza. 2. Pengkompil memutuskan yang berfungsi untuk memanggil pada masa penyusunan berdasarkan parameter yang disediakan. 3.

C mempunyai dua jenis polimorf utama: polimorfisme kompilasi masa dan polimorfisme jangka masa. 1. Polimorfisme masa kompilasi dilaksanakan melalui fungsi overloading dan templat, memberikan kecekapan yang tinggi tetapi boleh menyebabkan kod kembung. 2. Polimorfisme runtime dilaksanakan melalui fungsi maya dan warisan, memberikan fleksibiliti tetapi overhead prestasi.

Ya, polimorfisme di C sangat berguna. 1) Ia menyediakan fleksibiliti untuk membolehkan penambahan mudah jenis baru; 2) Menggalakkan penggunaan semula kod dan mengurangkan pertindihan; 3) Memudahkan penyelenggaraan, menjadikan kod lebih mudah untuk berkembang dan menyesuaikan diri dengan perubahan. Walaupun terdapat cabaran pengurusan prestasi dan memori, kelebihannya amat penting dalam sistem yang kompleks.

C destructorscanleadtoSeveralCommonerrors.toavoidthem: 1) pencegahandoubledeletionbysettingpointerstonullptrorusingsmartpointers.2)

Polimorfisme dalam C dibahagikan kepada polimorfisme runtime dan polimorfisme kompilasi masa. 1. Polimorfisme runtime dilaksanakan melalui fungsi maya, yang membolehkan kaedah yang betul dipanggil secara dinamik pada masa runtime. 2. Polimorfisme masa kompilasi dilaksanakan melalui fungsi overloading dan templat, memberikan prestasi dan fleksibiliti yang lebih tinggi.

Orang yang belajar python pemindahan ke c kekeliruan yang paling langsung adalah: Mengapa anda tidak boleh menulis seperti python? Kerana C, walaupun sintaks lebih kompleks, menyediakan keupayaan kawalan asas dan kelebihan prestasi. 1. Dari segi struktur sintaks, C menggunakan pendakap kerinting {} dan bukannya lekukan untuk mengatur blok kod, dan jenis pembolehubah mesti diisytiharkan secara eksplisit; 2. Dari segi sistem jenis dan pengurusan ingatan, C tidak mempunyai mekanisme pengumpulan sampah automatik, dan perlu menguruskan memori secara manual dan memberi perhatian kepada melepaskan sumber. Teknologi RAII boleh membantu pengurusan sumber; 3. 4. Dari segi perpustakaan standard, STL menyediakan bekas dan algoritma yang kuat, tetapi perlu menyesuaikan diri dengan idea pengaturcaraan generik; 5

C Polymorphisminkludescompile-time, runtime, andtemplatePolymorphism.1) compile-timePolymorphismusesfunctionandoperatoroveroveroverfiency.2) runtimepolymorphismemplempemplemplorfuntionsflonflexibility.3) TemplatePolymorphismenabenabenabenabenabenaben

C Polymorphismisuniqueduetoitscombinationofcompile-timeandruntimePolymorphism, membolehkanforbotheficiencyandflexibility.toharnessitspowerstylishly: 1) menggunakanmartpointerslikestd :: unik_ptrformemorymanagement, 2)
