數(shù)據(jù)科學(xué)領(lǐng)域的每個人都遇到了要求獨角獸的工作清單:編程語言和計算機科學(xué),統(tǒng)計和計量經(jīng)濟(jì)學(xué)以及商業(yè)領(lǐng)域的專家。如果您也可以進(jìn)行引人注目的數(shù)據(jù)可視化,那就太好了。可能會有一些人結(jié)合了所有這些特征,但它們之間相差無幾。隨著該領(lǐng)域的發(fā)展,職位描述已變得更加具體于其中一個領(lǐng)域,而最成功的數(shù)據(jù)科學(xué)團(tuán)隊正是受益于專業(yè)化和協(xié)作。工程師可能負(fù)責(zé)收集,清理和維護(hù)數(shù)據(jù)。統(tǒng)計員或經(jīng)濟(jì)學(xué)家可能正在對數(shù)據(jù)進(jìn)行分析,例如預(yù)測模型。可能會有一位可視化專家來弄清楚如何最好地交流模型所產(chǎn)生的見解,并由一位業(yè)務(wù)負(fù)責(zé)人來指導(dǎo)感興趣的問題。在所有這些級別上,都是人,他們對所收集的數(shù)據(jù),所提出的問題以及所提供的見解做出決策。
數(shù)據(jù)科學(xué)團(tuán)隊之所以成功,是因為每個成員都將自己的培訓(xùn),經(jīng)驗和觀點帶到了餐桌上。顯而易見,擁有多種技能可以解決更多創(chuàng)造性問題,但是通常并不能進(jìn)一步推斷結(jié)論,以認(rèn)識到多種多樣的生活經(jīng)驗也可以增強團(tuán)隊精神。
算法和模型塑造了我們的世界,吸收數(shù)據(jù)并以驚人的速度收集見解。根據(jù)數(shù)據(jù)建模的結(jié)果確定從電視節(jié)目更新到本地商店的所有雜貨的所有內(nèi)容。這些都是相對無害的結(jié)果,但是數(shù)據(jù)建模還確定了警察資源的分配方式以及被定罪的個人是否有可能再次犯罪。在一個完美的世界中,數(shù)據(jù)沒有偏見并且模型不需要人工輸入,這可能會導(dǎo)致最佳結(jié)果,但是我們并不生活在那個世界中。模型僅與其設(shè)計者一樣好,數(shù)據(jù)不知道它還沒有看到什么。
從根本上說,正是數(shù)據(jù)科學(xué)家在框定非常值得通過數(shù)據(jù)探索的問題。
從這種角度看,數(shù)據(jù)科學(xué)家具有很大的影響力,如果數(shù)據(jù)科學(xué)家是具有相似背景和興趣的同質(zhì)群體,那么它將縮小我們探索的世界,并限制了我們從數(shù)據(jù)中得出的見解的有效性。
同質(zhì)性不僅限于教育或技術(shù)背景。相關(guān)專業(yè)人表示數(shù)據(jù)科學(xué)家中有85%是男性,而預(yù)測分析師中有74%是男性。考慮到構(gòu)成這些專業(yè)的領(lǐng)域,這種聯(lián)系變得更加明顯:根據(jù)美國國家教育統(tǒng)計中心的數(shù)據(jù),2016年只有18%的計算機科學(xué)學(xué)士學(xué)位授予了女性。統(tǒng)計數(shù)據(jù)確實好,幾乎43%的女性和經(jīng)濟(jì)學(xué)落在某處大約31%,但考慮到整體,女性收入的57%都授予學(xué)士學(xué)位。鑒于教育中的數(shù)字十分明顯,在數(shù)據(jù)科學(xué)和預(yù)測分析行業(yè)中女性人數(shù)不足的不足為奇。當(dāng)然,缺乏代表性意味著我們提出的問題,我們在模型中使用的變量,甚至我們對這些模型的解釋都因我們行業(yè)內(nèi)的選擇偏見而歪曲。
最近被提醒了這一點:在花費大量時間和金錢嘗試使用AI來改善他們的聘用方式之后,他們發(fā)現(xiàn),該模型經(jīng)過對由他們過去成功聘用的人員構(gòu)成的令人難以置信的偏見數(shù)據(jù)進(jìn)行了訓(xùn)練,將會發(fā)現(xiàn)更加微妙的方法。過濾掉女人。亞馬遜的觀點是了解其算法的局限性,但是有多少公司以一種毫無希望的偏見方式應(yīng)用了數(shù)據(jù)科學(xué)卻從未見過?或者,如果算法的預(yù)測準(zhǔn)確,但應(yīng)用該知識卻沒有考慮潛在的負(fù)面結(jié)果,該怎么辦?目標(biāo)幾年前,這種情況發(fā)生了,當(dāng)時其數(shù)據(jù)科學(xué)團(tuán)隊能夠根據(jù)客戶的購買歷史準(zhǔn)確預(yù)測客戶何時懷孕,并使用該信息向客戶推銷與懷孕和嬰兒相關(guān)的物品。他們沒有考慮的是,這些營銷通告是針對家庭而不是個人,并且懷孕的人可能不希望共享這些信息,例如,一個十幾歲的女孩尚未告知父母其計劃外的懷孕。正如當(dāng)時的許多所指出的那樣,如果一名婦女因遭受暴力侵害而隱瞞自己的懷孕,那可能是一個災(zāi)難性的后果。在這種情況下,擁有更廣泛生活經(jīng)驗的更加多樣化的團(tuán)隊可能已經(jīng)注意到應(yīng)用其見解的潛在危險。
沒有寬廣的視野,您最終會不可避免地遭受想象力的失敗。這就是為什么像DSSe這樣的旨在提高女性在數(shù)據(jù)科學(xué)領(lǐng)域工作的計劃如此重要的原因。
在數(shù)據(jù)科學(xué)領(lǐng)域擁有更多的女性會影響到所有問題,從我們提出的問題到我們使用的工具再到我們探索的技術(shù)。通過提出我們的觀點,我們可以創(chuàng)建更好的模型并回答更有意義的問題。
例如,英特爾致力于實施一項雄心勃勃的計劃,以在2015年提高其員工隊伍的多樣性。近三年后,他們將婦女和少數(shù)族裔群體中的代表性提高了63%,并且在不以任何方式犧牲盈利能力的情況下做到了這一點-不足為奇,據(jù)摩報告顯示,性別高度多元化的公司可以在波動性較小的情況下獲得更高的回報。數(shù)據(jù)科學(xué)還很年輕,我們有機會塑造這個領(lǐng)域,以反映它所探索的世界。它現(xiàn)在可能會偏向男性,但是通過DSSe等計劃,該領(lǐng)域女性之間的指導(dǎo)以及考慮到從事數(shù)據(jù)科學(xué)職業(yè)的年輕女性的有針對性的鼓勵,很快,數(shù)據(jù)科學(xué)將擁有可以真正提升該領(lǐng)域的多種視角。
上述就是關(guān)于從女性角度看數(shù)據(jù)的全部內(nèi)容介紹,想了解更多關(guān)于大數(shù)據(jù)的信息,請繼續(xù)關(guān)注中培偉業(yè)。