国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

首頁 web前端 js教程 如何在 Postgres SQL 中刪除重複項(xiàng)

如何在 Postgres SQL 中刪除重複項(xiàng)

Nov 26, 2024 pm 03:48 PM

How to remove duplicates in Postgres SQL


交叉發(fā)佈在我的部落格上
您可以在這裡閱讀


我們的架構(gòu)

create table "post" (
  id SERIAL PRIMARY KEY,
  title VARCHAR(255) NOT NULL,
  content TEXT NOT NULL
);

create table "user" (
  id SERIAL PRIMARY KEY,
  name VARCHAR(255) NOT NULL
)

create table "post_like" (
  id SERIAL PRIMARY KEY,
  post_id INTEGER NOT NULL REFERENCES post(id),
  user_id INTEGER NOT NULL REFERENCES user(id)
)

現(xiàn)在我們要確保每個(gè)用戶不能多次喜歡同一個(gè)貼文。
這可以透過以下方式避免:

  • 對 post_like 表的一對 post_id user_id 欄位使用唯一約束。
  • 或刪除post_like表的id列並在post_id user_id上使用複合主鍵

但是,假設(shè)我們已經(jīng)存在重複項(xiàng),我們需要?jiǎng)h除它們。

檢查是否有重複

select 
  post_id, 
  user_id,
  count(*)
from post_like
group by post_id, user_id
having count(*) > 2
;

| post_id | user_id | count |
| ------- | ------- | ----- |
| 3       | 2       | 2     |

此輸出告訴我們用戶 2 喜歡貼文 3 不只一次,具體來說是 2 次。

刪除重複項(xiàng)

現(xiàn)在我們知道存在重複項(xiàng),我們可以刪除它們。

我們將此過程分為兩步驟:

  • 讀取重複項(xiàng)
  • 刪除重複項(xiàng)(試運(yùn)行)
  • 刪除重複項(xiàng)(實(shí)際運(yùn)行)

讀取重複項(xiàng)

事務(wù)回滾

為了在不刪除真實(shí)資料的情況下測試我們的查詢,直到我們確定查詢正確為止,我們使用交易回滾功能。

透過這樣做,我們的查詢將永遠(yuǎn)不會被提交,類似於
您可以在其他應(yīng)用程式上找到「試運(yùn)行」概念(例如
rsync)。

CTE

我們使用 CTE 因?yàn)樗峁┝肆己玫?DX。

使用 CTE,我們可以執(zhí)行查詢,將結(jié)果儲存在臨時(shí)表中,然後使用同一表進(jìn)行後續(xù)查詢。

這種心理模型類似於我們通常在編碼中創(chuàng)建臨時(shí)變數(shù)的做法。

CTE 語法為

 with 
 <cte_name> as (
   <query>
 ),
 <cte_name_2> as (
   <query_2> -- here we can refernce <cte_name>
 )
 <final_query> -- here we can refernce <cte_name> and <cte_name_2>

透過交易和 CTE,我們可以執(zhí)行以下操作:

begin; -- start transaction

with
duplicates_info as (
  select
    row_number() over (
      partition by post_id, user_id order by user_id
    ) as group_index,
    id,
    post_id,
    user_id
  from post_like
)
select *
from duplicates_info
;

rollback; -- ends transaction discarding every changes to the database 

| group_index | id | post_id | user_id |
| ----------- | -- | ------- | ------- |
| 1           | 1  | 1       | 1       |
| 1           | 2  | 2       | 2       |
| 1           | 3  | 3       | 2       |
| 2           | 4  | 3       | 2       |

最新一行結(jié)果,其中g(shù)roup_index為2,表示該行是post_id = 3且user_id = 2的群組中的第二行。

這裡的文法會發(fā)生什麼事?

row_number() over (partition by ...) as group_index 是一個(gè)視窗函數(shù),它首先按partition by 子句中的列對行進(jìn)行分組,然後根據(jù)行的索引為每行分配一個(gè)數(shù)字在群組裡。

partition 與 group by 類似,因?yàn)樗鼤垂擦袑π羞M(jìn)行分組,但如果 group by 每組只傳回 1 行,partition 讓我們根據(jù)群組向來源表新增列。

group_index是列名別名,常規(guī)sql語法。

僅過濾重複項(xiàng)

現(xiàn)在讓我們只保留 group_index > 的項(xiàng)目1,這意味著該行不是群組中的第一行,或者換句話說,它是重複的。

create table "post" (
  id SERIAL PRIMARY KEY,
  title VARCHAR(255) NOT NULL,
  content TEXT NOT NULL
);

create table "user" (
  id SERIAL PRIMARY KEY,
  name VARCHAR(255) NOT NULL
)

create table "post_like" (
  id SERIAL PRIMARY KEY,
  post_id INTEGER NOT NULL REFERENCES post(id),
  user_id INTEGER NOT NULL REFERENCES user(id)
)

select 
  post_id, 
  user_id,
  count(*)
from post_like
group by post_id, user_id
having count(*) > 2
;

我們只需刪除 ID 為 4 的這一行。

刪除重複項(xiàng) - 試運(yùn)行

現(xiàn)在重寫最終查詢,以便我們從 post_like 表中讀取,而不是再從 cte煩人的_info 中讀取。
我們?nèi)匀皇褂?cte duplics_info 來取得重複項(xiàng)的 id。

| post_id | user_id | count |
| ------- | ------- | ----- |
| 3       | 2       | 2     |

我們將看到我們想要?jiǎng)h除的記錄。

在我們檢查它們正確後,我們將選擇與刪除交換。

 with 
 <cte_name> as (
   <query>
 ),
 <cte_name_2> as (
   <query_2> -- here we can refernce <cte_name>
 )
 <final_query> -- here we can refernce <cte_name> and <cte_name_2>

最後一個(gè)查詢是我們最終想要執(zhí)行的。

但因?yàn)槲覀冞€有回滾語句,所以這些變更是模擬的,並沒有應(yīng)用到資料庫。

刪除重複項(xiàng) - 真實(shí)運(yùn)行

最後我們可以真正刪除重複了。
這裡我們使用提交而不是回滾,以便將變更應(yīng)用到資料庫。

begin; -- start transaction

with
duplicates_info as (
  select
    row_number() over (
      partition by post_id, user_id order by user_id
    ) as group_index,
    id,
    post_id,
    user_id
  from post_like
)
select *
from duplicates_info
;

rollback; -- ends transaction discarding every changes to the database 

最終程式碼

| group_index | id | post_id | user_id |
| ----------- | -- | ------- | ------- |
| 1           | 1  | 1       | 1       |
| 1           | 2  | 2       | 2       |
| 1           | 3  | 3       | 2       |
| 2           | 4  | 3       | 2       |

結(jié)論

我寫文章主要是為了幫助自己的未來,或是幫助我在工作中所使用的工具的發(fā)展。

如果這篇文章對您有幫助,請按讚。

你想讓我談一個(gè)特定的話題嗎?

在評論裡告訴我吧!

以上是如何在 Postgres SQL 中刪除重複項(xiàng)的詳細(xì)內(nèi)容。更多資訊請關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本網(wǎng)站聲明
本文內(nèi)容由網(wǎng)友自願投稿,版權(quán)歸原作者所有。本站不承擔(dān)相應(yīng)的法律責(zé)任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容,請聯(lián)絡(luò)admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費(fèi)脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅(qū)動的應(yīng)用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費(fèi)的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費(fèi)的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強(qiáng)大的PHP整合開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

Java vs. JavaScript:清除混亂 Java vs. JavaScript:清除混亂 Jun 20, 2025 am 12:27 AM

Java和JavaScript是不同的編程語言,各自適用於不同的應(yīng)用場景。 Java用於大型企業(yè)和移動應(yīng)用開發(fā),而JavaScript主要用於網(wǎng)頁開發(fā)。

JavaScript評論:簡短說明 JavaScript評論:簡短說明 Jun 19, 2025 am 12:40 AM

JavascriptconcommentsenceenceEncorenceEnterential gransimenting,reading and guidingCodeeXecution.1)單inecommentsareusedforquickexplanations.2)多l(xiāng)inecommentsexplaincomplexlogicorprovideDocumentation.3)

如何在JS中與日期和時(shí)間合作? 如何在JS中與日期和時(shí)間合作? Jul 01, 2025 am 01:27 AM

JavaScript中的日期和時(shí)間處理需注意以下幾點(diǎn):1.創(chuàng)建Date對像有多種方式,推薦使用ISO格式字符串以保證兼容性;2.獲取和設(shè)置時(shí)間信息可用get和set方法,注意月份從0開始;3.手動格式化日期需拼接字符串,也可使用第三方庫;4.處理時(shí)區(qū)問題建議使用支持時(shí)區(qū)的庫,如Luxon。掌握這些要點(diǎn)能有效避免常見錯(cuò)誤。

為什麼要將標(biāo)籤放在的底部? 為什麼要將標(biāo)籤放在的底部? Jul 02, 2025 am 01:22 AM

PlacingtagsatthebottomofablogpostorwebpageservespracticalpurposesforSEO,userexperience,anddesign.1.IthelpswithSEObyallowingsearchenginestoaccesskeyword-relevanttagswithoutclutteringthemaincontent.2.Itimprovesuserexperiencebykeepingthefocusonthearticl

JavaScript與Java:開發(fā)人員的全面比較 JavaScript與Java:開發(fā)人員的全面比較 Jun 20, 2025 am 12:21 AM

JavaScriptIspreferredforredforwebdevelverment,而Javaisbetterforlarge-ScalebackendsystystemsandSandAndRoidApps.1)JavascriptexcelcelsincreatingInteractiveWebexperienceswebexperienceswithitswithitsdynamicnnamicnnamicnnamicnnamicnemicnemicnemicnemicnemicnemicnemicnemicnddommanipulation.2)

JavaScript:探索用於高效編碼的數(shù)據(jù)類型 JavaScript:探索用於高效編碼的數(shù)據(jù)類型 Jun 20, 2025 am 12:46 AM

javascripthassevenfundaMentalDatatypes:數(shù)字,弦,布爾值,未定義,null,object和symbol.1)numberSeadUble-eaduble-ecisionFormat,forwidevaluerangesbutbecautious.2)

什麼是在DOM中冒泡和捕獲的事件? 什麼是在DOM中冒泡和捕獲的事件? Jul 02, 2025 am 01:19 AM

事件捕獲和冒泡是DOM中事件傳播的兩個(gè)階段,捕獲是從頂層向下到目標(biāo)元素,冒泡是從目標(biāo)元素向上傳播到頂層。 1.事件捕獲通過addEventListener的useCapture參數(shù)設(shè)為true實(shí)現(xiàn);2.事件冒泡是默認(rèn)行為,useCapture設(shè)為false或省略;3.可使用event.stopPropagation()阻止事件傳播;4.冒泡支持事件委託,提高動態(tài)內(nèi)容處理效率;5.捕獲可用於提前攔截事件,如日誌記錄或錯(cuò)誤處理。了解這兩個(gè)階段有助於精確控制JavaScript響應(yīng)用戶操作的時(shí)機(jī)和方式。

Java和JavaScript有什麼區(qū)別? Java和JavaScript有什麼區(qū)別? Jun 17, 2025 am 09:17 AM

Java和JavaScript是不同的編程語言。 1.Java是靜態(tài)類型、編譯型語言,適用於企業(yè)應(yīng)用和大型系統(tǒng)。 2.JavaScript是動態(tài)類型、解釋型語言,主要用於網(wǎng)頁交互和前端開發(fā)。

See all articles