P的ANDA庫是數(shù)據(jù)科學(xué)家的事實(shí)上的標(biāo)準(zhǔn)工具,時(shí)下。它被全球許多數(shù)據(jù)科學(xué)家廣泛使用。熟悉它之后,無論我從事什么項(xiàng)目,我總是將其用于處理表結(jié)構(gòu)數(shù)據(jù)。它工作快速可靠,支持CSV,Excel,JSON等。但是,作為一個(gè)有SQL經(jīng)驗(yàn)的人,一開始我在操作表(aka DataFrames)時(shí)遇到了一些困難和困惑。最終,我了解了更多的API和正確執(zhí)行操作的方法。我相信許多對(duì)熊貓邁出第一步的人可能都有相同的經(jīng)歷。前段時(shí)間,我使用SQL查詢及其在Pandas中的類比編寫了備忘單。我很高興與大家分享。在這篇文章中,將使用“ SELECT”共享查詢。稍后,我將向熊貓發(fā)布其他查詢及其類比。我很高興收到您關(guān)于備忘單的反饋和愿望清單。
我們有三個(gè)簡(jiǎn)單的表:
· 使用者
· 培訓(xùn)班
· 出勤率
其余的查詢將涉及對(duì)它們的數(shù)據(jù)操作。
讓我們從基本的SELECT命令開始。
· 選擇*來自用戶
· 選擇*來自用戶LIMIT 0,10
· 選擇*來自用戶,電子郵件為空
· 從用戶中選擇名字,姓氏
· SELECT DISTINCT birth_year來自用戶
基本的數(shù)學(xué)和算術(shù)運(yùn)算。
· 從用戶中選擇AVG(點(diǎn));
· 從用戶中選擇總和(點(diǎn));
有條件的操作和喜歡。
· 選擇*從1998年至2018年之間的出生年齡的用戶
· SELECT * FROM users where where first_name LIKE'Ch%'
· SELECT * FROM users where where first_name LIKE'%es'
· SELECT * FROM users where where first_name LIKE'%on%'
· 從用戶那里選擇first_name,last_name,例如first_name,例如'%on%'
我用JOIN和ORDER BY相關(guān)的SQL查詢來結(jié)束這篇文章。為了使代碼更簡(jiǎn)單易讀,我將結(jié)果分配到新變量中,并在下一個(gè)變量中重新使用它們。
· SELECT * FROM出勤atn
· LEFT JOIN用戶usr ON atn.user_id = usr.id
現(xiàn)在讓我們將上面的結(jié)果與課程標(biāo)題一起加入。其結(jié)果將與以下SQL命令的結(jié)果相同。
· SELECT * FROM atn atn
· LEFT JOIN用戶usr ON atn.user_id = usr.id
· LEFT JOIN課程co ON co.id = atn.course_id
上面的查詢將返回包含所有列的完整表/數(shù)據(jù)框。要選擇必要的列,我們可以使用與以前相同的方法。
· SELECT * FROM users ORDER BY first_name,last_name
· SELECT * FROM users ORDER BY first_name,last_name DESC
· SELECT first_name,last_name,birth_year,
· 積分,course_name,講師FROM出勤atn
· LEFT JOIN用戶usr ON atn.user_id = usr.id
· LEFT JOIN課程co ON co.id = atn.course_id
· ORDER BY first_name,last_name
以上就是關(guān)于適用于SQL人員的Pandas速查表的全部內(nèi)容,想了解更多關(guān)于SQL數(shù)據(jù)庫的信息,請(qǐng)繼續(xù)關(guān)注中培偉業(yè)。