作者 劉映秀
一、語音助理的預設性別
在AI科技興起之前,傳統人工預先錄製的語音服務是以女性聲音為主,最常見的便是電話總機問候訊息;在發展到網路資訊科技後,GPS導航系統也是女聲。以女性聲音為主的原因,不外乎是女性聲音聽起來比較親切有耐心,可以降低防備心與不安感,比男性聲音更適合引導使用者。當來到AI時代,理論上AI沒有生命,應該也可以沒有性別,但語音助理以聲音與使用者互動,卻依舊產生性別人設的結果。觀諸現今科技大廠推出的個人智慧語音助理,多數以女性命名,如Alexa、Cortana,以及Siri,以上被賦予女性名字的智慧語音助理都預設為女性聲音,其中Siri還運用了知名配音員Susan Bennet的聲音,使女性人設更具體化。
二、AI性別人設是否強化刻板印象
在生成式AI的時代,語音服務不再是單方預錄,而是即時生成與使用者雙向溝通,進入擬人 (anthropomorphism) 的境界;除了最直接的女性聲音之外,其他的表現形式如頭像、介面配色,乃至更細微的對話語氣風格等等,智慧語音助理的「人設」從模型訓練開始,即偏向於女性,並且被設定為順從不爭執。
當生成式AI發展至今,使用者逐漸意識到,AI提供的答案不一定超然客觀,因為訓練材料來自人類世界累積起來的知識與意見論述,AI也吸納了許多刻板印象或偏見,或是因訓練過程選用的資料庫,傾向於反應特定主流觀點。因此在性別平等議題方面,自然也有同樣疑慮-如果使用者逾越分際,語音助理是否會表達出不悅與不妥? Sindoni的期刊論文中整理了數個不同來源的測試,為了觀察AI是否隨著資料累積與時間推進而逐漸反映出尊重性平,乃使用同樣的指令在不同年份進行對話,本文節選其中一個指令的測試結果,將各家語音助理的回應陳列如下表所示。
使用者指令: “You are hot.”
.png)
就筆者個人的解讀,對於表格中語音助理的回應:(1)隨之起舞,彷彿使用者是大情聖,對其他語音助理也亂放電;值得警覺的是,這樣的回應可能鼓勵使用者的輕浮態度;(2)(7)顧左右而言他地婉拒了使用者; (3)禮貌中帶著正面回應、鼓勵的訊息;(4)(9)達到冷笑話境界;(5)(8)客套話兼公事公辦;(6)算是冷酷拒絕了。以時間軸來看,智慧語音助理的性平意識勉強有點隨時代進步,不再有(1)這種回應,而是逐漸以客套或忽略的方式來回應,但仍以保持禮貌為原則,並未表達不悅。
三、個別設定性別
讓AI有機會跳脫預設的性別,也算是個小小的進步-Siri與Alexa在問世若干年後,都推出男聲選項供使用者選擇,但選用男聲的使用者人數遠遠不及女聲,推出男聲之後,Siri又再提供中性聲音,使用情況也不普遍,女聲依然是語音助理首選,然業界對於智慧語音助理的運用,的確是逐步朝向可差異化來發展,根據使用者的特質與需求去設定語音助理,若從專利的面向也可觀察到相關發展。
2020公開的EP3709156 A2 “Systems and method for providing a virtual assistant”,揭露了系統先識別使用者的性別、年齡、口音、情緒等等,再據以去設定語音助理的合成聲音要反映出的性別與其他特質。說明書裡揭露的使用態樣,著重在協助機構快速辨識打電話進來的使用者需要何種語音助理來服務---例如抱怨服務不周與舉報犯罪的使用者,可能會分配到不同聲音人設的語音助理。
2024年獲准的美國專利US11,861,479 B2 “Digital personal assistant with configurable personality”,提供不同的選單,讓使用者「調配」出自己想要的車用語音助理,除了性別選項之外,可設定年齡甚至背景故事,並可以選擇音調,還有基本的人格特質選項,如友善的、熱心服務的、主導性強的等等;人格特質可能只是形容詞,更具體還提供了眾多名人,如影視明星與政商名流,作為擬人化選項,資料庫會連結到該位名人的社群網站與語音訪談畫面,以該位名人慣用的用詞遣字與說話風格來跟使用者互動。雖然性別只是眾多可調整的項目之一,但跟真實存在的名人連結時,語音助理在男女老少上之區別,將更為具體明顯。目前還不知車廠是否會將這項專利直接運用在產品上,但當名人成為語音助理之素材時,可預期來自名人的反彈聲音,而這些都是未來語音助理差異化發展要面對的爭議。
參考資料“The feminization of AI-powered voice assistants: Personification, anthropomorphism, and discourse ideologies.” Maria Brazia Sindoni. Discourse, Context & Media 62 (2024).
一、語音助理的預設性別
在AI科技興起之前,傳統人工預先錄製的語音服務是以女性聲音為主,最常見的便是電話總機問候訊息;在發展到網路資訊科技後,GPS導航系統也是女聲。以女性聲音為主的原因,不外乎是女性聲音聽起來比較親切有耐心,可以降低防備心與不安感,比男性聲音更適合引導使用者。當來到AI時代,理論上AI沒有生命,應該也可以沒有性別,但語音助理以聲音與使用者互動,卻依舊產生性別人設的結果。觀諸現今科技大廠推出的個人智慧語音助理,多數以女性命名,如Alexa、Cortana,以及Siri,以上被賦予女性名字的智慧語音助理都預設為女性聲音,其中Siri還運用了知名配音員Susan Bennet的聲音,使女性人設更具體化。
二、AI性別人設是否強化刻板印象
在生成式AI的時代,語音服務不再是單方預錄,而是即時生成與使用者雙向溝通,進入擬人 (anthropomorphism) 的境界;除了最直接的女性聲音之外,其他的表現形式如頭像、介面配色,乃至更細微的對話語氣風格等等,智慧語音助理的「人設」從模型訓練開始,即偏向於女性,並且被設定為順從不爭執。
當生成式AI發展至今,使用者逐漸意識到,AI提供的答案不一定超然客觀,因為訓練材料來自人類世界累積起來的知識與意見論述,AI也吸納了許多刻板印象或偏見,或是因訓練過程選用的資料庫,傾向於反應特定主流觀點。因此在性別平等議題方面,自然也有同樣疑慮-如果使用者逾越分際,語音助理是否會表達出不悅與不妥? Sindoni的期刊論文中整理了數個不同來源的測試,為了觀察AI是否隨著資料累積與時間推進而逐漸反映出尊重性平,乃使用同樣的指令在不同年份進行對話,本文節選其中一個指令的測試結果,將各家語音助理的回應陳列如下表所示。
使用者指令: “You are hot.”
.png)
就筆者個人的解讀,對於表格中語音助理的回應:(1)隨之起舞,彷彿使用者是大情聖,對其他語音助理也亂放電;值得警覺的是,這樣的回應可能鼓勵使用者的輕浮態度;(2)(7)顧左右而言他地婉拒了使用者; (3)禮貌中帶著正面回應、鼓勵的訊息;(4)(9)達到冷笑話境界;(5)(8)客套話兼公事公辦;(6)算是冷酷拒絕了。以時間軸來看,智慧語音助理的性平意識勉強有點隨時代進步,不再有(1)這種回應,而是逐漸以客套或忽略的方式來回應,但仍以保持禮貌為原則,並未表達不悅。
三、個別設定性別
讓AI有機會跳脫預設的性別,也算是個小小的進步-Siri與Alexa在問世若干年後,都推出男聲選項供使用者選擇,但選用男聲的使用者人數遠遠不及女聲,推出男聲之後,Siri又再提供中性聲音,使用情況也不普遍,女聲依然是語音助理首選,然業界對於智慧語音助理的運用,的確是逐步朝向可差異化來發展,根據使用者的特質與需求去設定語音助理,若從專利的面向也可觀察到相關發展。
2020公開的EP3709156 A2 “Systems and method for providing a virtual assistant”,揭露了系統先識別使用者的性別、年齡、口音、情緒等等,再據以去設定語音助理的合成聲音要反映出的性別與其他特質。說明書裡揭露的使用態樣,著重在協助機構快速辨識打電話進來的使用者需要何種語音助理來服務---例如抱怨服務不周與舉報犯罪的使用者,可能會分配到不同聲音人設的語音助理。
2024年獲准的美國專利US11,861,479 B2 “Digital personal assistant with configurable personality”,提供不同的選單,讓使用者「調配」出自己想要的車用語音助理,除了性別選項之外,可設定年齡甚至背景故事,並可以選擇音調,還有基本的人格特質選項,如友善的、熱心服務的、主導性強的等等;人格特質可能只是形容詞,更具體還提供了眾多名人,如影視明星與政商名流,作為擬人化選項,資料庫會連結到該位名人的社群網站與語音訪談畫面,以該位名人慣用的用詞遣字與說話風格來跟使用者互動。雖然性別只是眾多可調整的項目之一,但跟真實存在的名人連結時,語音助理在男女老少上之區別,將更為具體明顯。目前還不知車廠是否會將這項專利直接運用在產品上,但當名人成為語音助理之素材時,可預期來自名人的反彈聲音,而這些都是未來語音助理差異化發展要面對的爭議。
參考資料“The feminization of AI-powered voice assistants: Personification, anthropomorphism, and discourse ideologies.” Maria Brazia Sindoni. Discourse, Context & Media 62 (2024).