读当我点击时,算法在想什么?01算法在监视我们(上)

躺柒 2025-02-14 15:48:07

1. 危机

1.1. 一位数学家认为,算法无法操控我们,因为我们远比算法聪明。但数学没有道破我们所面临的危机

1.2. 我们人类的大脑显得微不足道,因为我们的大脑最多只能具象化4 个维度

1.3. 谷歌翻译(Google Translate)的系统能将几百种语言分解成多维词义矩阵,这些矩阵会创造出我们无法理解的、只属于它们自己的形而上语言,并将各种语言的内隐偏见包含其中

1.4. 作为学术论文搜索引擎的谷歌学术(Google Scholar)也会根据每篇论文的被引用次数来对其学术影响力进行排名

1.5. 不管是在精英群体中还是在更易接近但自我意识稍弱的普通民众中,过滤气泡、肤浅的排序机制和算法推荐的毒害都有迹可循

1.5.1. 我们都在被假新闻愚弄、被困在不断强化偏见的过滤气泡中难以脱身等

1.6. 现实社会中的歧视问题需要优先被解决

1.6.1. 未能预见这些平台会被别有用心的政治煽动者利用,或者被用来监控整个国家、审查每个网民

1.6.2. 我们之所以相信剑桥分析公司的方法行之有效,更多的是因为我们相信了该公司管理层的夸张宣传,而并不关心其背后的数学支持是否牢固可靠

1.6.3. 受技术决定论所造成的文化盲区的影响,人们往往只关注主流社会和发达国家,却对其他国家和地区的情况视而不见

1.6.4. 对于语言翻译系统中的偏见,“如果不首先解决现实社会中的种族主义和性别歧视问题,就没有办法真正解决由无监督学习造成的问题”

1.7. 算法歧视

1.7.1. 算法得出的结论也可能是歧视性的

1.7.2. 算法将非裔美国人划分到高风险犯罪类别的可能性要高出其他族裔45%

1.7.2.1. 歧视并不仅限于司法系统

1.7.3. 基于他们的“种族相似性”(脸书通过查看用户浏览的页面和参与互动的帖子来衡量)而不是他们实际所属的种族,也是一种歧视

1.8. 在当今的算法系统中,人类的监管必不可少,但他的分析似乎无法解释捣蛋鬼的行为,以及那些无视所有证据,继续生活在阴谋论、偏见和权力欲中的人的行为

1.8.1. 也许我们遭遇的算法危机根本就不只是一个数学问题

1.8.2. 再多的数学知识也无法帮助我们重新获得日渐失去的生活主动权,也无法击败那些故意利用数学的复杂性来对付我们的人

2. 算法在监视我们

2.1. 人工智能将成为终极版的谷歌

2.2. 通过数学来追踪世界上最负盛名的涂鸦艺术家

2.2.1. 充分发挥想象力,然后合理运用数学方法

2.3. DeepMind(深度思维)是谷歌的一个研究部门

2.3.1. 它已经让一台计算机成了世界上最好的围棋选手

2.3.2. 并开发了一种算法来精通《太空入侵者》(SpaceInvaders)等老式街机游戏的玩法

2.3.3. 它可通过检索英国国民医疗服务系统(National Health Service, NHS)的患者诊断记录,找出疾病发生的模式

2.4. 如今涉及健康和生活方式的数据库正在以前所未有的速度积累数据

2.4.1. 谷歌过去一直遵守严格的数据保护原则,但泄密的风险始终存在

2.5. 只要让球员佩戴 24 小时的健康和营养监控设备,他们就能更全面了解球员的身体状况

2.5.1. 对于谷歌人来说,他们获得的数据越多越好

3. 数学杀伤性武器

3.1. 算法的使用无处不在,它帮我们更好地认识这个世界

3.1.1. 现实世界和数学间的相互作用从来都不是非黑即白的

3.1.2. 审视数据,统计数据,并且进行数学运算

3.2. 象牙塔和外界的完美隔绝意味着我们的理论不会被现实挑战

3.2.1. 现实世界存在实际问题,为这些问题提供实际解决方案是我们义不容辞的责任

3.2.2. 除了计算,每一个现实问题都有其复杂的方面

3.3. 我们的目的就是通过数据和算法让生活变得更美好

3.3.1. 我们设计算法来识别面孔、理解语言、了解我们的音乐品味

3.3.2. 我们创建个人助理和聊天机器人来帮你排除电脑故障

3.3.3. 我们预测选举和比赛结果

3.3.4. 我们帮助单身人士找到理想伴侣,或帮助他们对现有的潜在交往对象一一筛选

3.3.5. 我们尝试在脸书和推特(Twitter)[插图]上给你推送与你最为密切相关的新闻

3.3.6. 我们确保你找到最佳的假日去处和廉价航班

3.4. 负面

3.4.1. 谷歌搜索引擎提供带种族偏见的搜索建议

3.4.2. 推特上的机器人账号传播虚假新闻

3.4.3. 斯蒂芬·霍金(Stephen Hawking)担忧人工智能的潜在危害

3.4.4. 极右翼分子(极端保守主义者)在算法建立的过滤气泡里结党聚集

3.4.5. 脸书分析我们的个性并用于锁定目标选民

3.5. 人工智能警官

3.5.1. 通过我们的搜索和浏览数据推断我们的动机和未来行为

3.5.2. 每个“人工智能警官”会配备一个行动小组,以便他们在深夜对潜在的恐怖分子发起突袭

3.5.3. 这种黑暗的数学未来正以骇人的速度接近你我

4. 算法无处不在

4.1. 从唐纳德·特朗普(Donald Trump)在他竞选期间利用政治顾问公司剑桥分析来影响选民,到统计学家对英国脱欧公投预测的失败,这些重大事件无一不牵涉到算法

4.2. 私人生活在逐渐公开化

4.2.1. 我们在线分享我们的生活方式、我们的抱负、我们的行为举止和我们的在线社交

4.2.2. 没有人监督华尔街和硅谷公司用来分析我们的工具

4.3. 最关注数据的透明性和潜在的偏见

4.3.1. 黑箱影响着我们看到的信息、做着关于我们的种种决定,而这些算法的运作方式我们却无从知晓

4.4. 包括谷歌、雅虎、脸书、微软和苹果在内的所有互联网巨头都会预测我们的兴趣并进行用户画像,并利用这些信息来决定展示给我们什么广告

4.4.1. 这些服务在一定程度上是透明的,允许用户查看他们的设置

4.5. 给重定向广告加点“噪声”

4.5.1. 重定向广告是一个技术术语,指的是采用搜索历史来决定展示给用户何种产品的在线广告

4.5.2. 与谷歌和脸书不同,互联网服务提供商几乎不会公开他们所收集的信息

4.5.2.1. 互联网服务提供商可能会将你的浏览历史记录与你的家庭住址联系起来,并与第三方广告商分享你的数据

4.5.3. “噪声”插件

4.5.3.1. 作用就是产生浏览噪声

4.5.3.2. 当她浏览她喜欢的网站时,“噪声”就会在后台工作并随机浏览排名前 40 位的新闻网站

4.5.3.3. 互联网服务提供商就没有办法知道她对哪些网站感兴趣,对哪些网站不感兴趣

4.5.3.4. “噪声”让她的浏览器再也不知道她是谁了

4.5.3.4.1. 公司和各种利益团体就失去了透视我们的能力

4.6. 认识向我们推销产品的算法并确保互联网服务供应商尊重我们的权利,则是我们自己的责任了

4.6.1. 许多不易察觉的歧视现象需要我们去发现并加以制止,一些关于短期借贷和“野鸡大学”文凭的定向广告也确实不合道德,而且我们的网页浏览器有时还会对我们做出一些奇怪的判断

5. 分类的算法

5.1. 主成分分析的方法

5.1.1. Principal Component Analysis,PCA

5.1.2. 主成分分析法是一种统计方法,它可以对原始的 13 维数据集进行旋转以揭示帖子之间最重要的关联,其中每个帖子的类别都是单一维度

5.1.3. 第一主成分(即数据中体现的最强相关性)是一条直线,往右依次为家庭/伴侣、生活方式和朋友,往左依次为笑话/段子、工作和政治/新闻

5.1.3.1. 是对朋友们进行区分的最重要关系

5.1.4. 数据中第二重要的关系将工作与爱好区分开来,往上是工作和生活方式,往下是音乐/体育/电影、政治/新闻和其他关于文化的帖子

5.2. k -均值聚类

5.2.1. k-means clustering

5.2.2. 根据不同的人在主成分分析法建立的维度里相互之间的距离来将他们分组,最终形成了三个类别:使用脸书专注于个人生活的人(小方框)、关注自己工作和与工作相关的生活方式的人(圆圈),以及用脸书来对社会事件发表评论的人(小叉)

5.3. 主成分分析和类似的数学方法是大多数对我们行为进行分类的算法的基础

5.3.1. 预测曾经犯过罪的人是否会再次犯罪的模型中也使用了这种方法,通过被告提供的问卷调查预测他是否还会犯下更多罪行

5.3.2. 推特用它来计算你赚了多少钱

5.3.3. 谷歌用它来评估你的广告偏好

5.3.4. 其中所涉及的数据量和用来对我们进行分类的维度要大得多,但是方法毫无二致

5.3.4.1. 不停地旋转和降维,直到算法开始读懂你,透视你

5.4. 预测犯过罪的人是否会再次犯罪是由黑箱执行的,脸书和谷歌广告也是通过黑箱生成的,追寻班克西仍是由黑箱来完成的

0 阅读:7

躺柒

简介:书既能读薄也能读厚,输出才能检验输入,完成才能完善。