数据科学与数据隐私工作的改善世界
通过艾玛·里德
这个博客来自琥珀Yandow,数据科学主题专家,教练,导师,教练,曾与思科开发数据科学概论课程,现在免费技能从思科网络学院。您可以了解更多关于琥珀的旅程的女性磐石回放”有什么令人兴奋的科学数据?”。琥珀在23:14马克加入。
作为一个数据科学家,我的工作是分析数据,帮助解决问题。世界不仅digitizes-with移动设备,但传感器和其他物联网技术(物联网)像wearables-the数据量呈指数级增长。
国际数据公司预测,到2025年全球边界163字节,从2016年的16.1 zb,平均连接人与连接设备每天近4800次。
生成和收集的数据量,数据隐私是越来越重要。数据隐私日由欧洲委员会制定了在2007年数据保护的一天每年1月28日,是一样很好的一天,这意味着什么。
数据的价值
收集的数据通常是在三个方面:
- 观察—科学家宣告首张快速检测人类,分析师甚至营销人员观察客户行为和记录。
- 推论拼可以推断基于用户的搜索历史记录,购买或社交媒体活动。
- 自愿(提供数据通过调查和组织形式。
一旦数据已经整理它可以用于解决问题和回答问题。数据科学依赖于数据涉及到你想解决的问题或你想回答的问题,所以个人身份信息(PII)在许多情况下是没有必要的。重要的是你要解决的问题的数据代表。必须为一个数据科学家能够识别排除数据时,例如,为了避免错误或偏见在人工智能和机器学习环境。
数据隐私为什么如此重要
数据通常存储在本地服务器或在云上。这是一个公司的道德和法律责任照顾隐私方面。很多次,责任将属于数据工程师或数据库管理员的权限。
匿名化数据通过删除或加密直接对个人标识符,如人的全名、地址、电子邮件、个人识别号码,物理描述,或生物info-the PII-and防止reidentify他们的能力,是确保数据隐私的一种方式。
麦肯锡认为,有效的监管数据匿名化实际上是一个机会个人和组织,通过减少风险,同时使数据更可用于分析。
数据保护法律不同国家,但也有共同的实践,比如:预防数据丢失和数据发现策略;频繁的备份;内置保护,如复制、防火墙、加密、授权和身份验证;和擦除和恢复策略。
欧盟的总体数据保护监管(GDPR)可以说是最宽的范围。欧盟基本权利宪章》规定,欧盟公民有权利保护他们的个人数据,和GDPR下罚款1031发行在2022年3月,总计15.81亿€。
应该注意的是,这些罚款不征收反对网络罪犯,但知名企业违反规则的法律依据不足等数据处理;不符合一般数据处理原则;和足够的技术和组织措施,确保信息安全。
在线作为一个个体,你会做什么呢?
有许多事情你可以做什么来保护您的数据。最基本的事情:
- 使用强密码,至少11字的大写或小写字母,符号和数据将网络犯罪至少400年破解你的密码符合这些条件。长密码使它更加困难。
- 备份你的数据
- 不要打开可疑邮件
- 从来没有提供个人资料在电话里像一个政府ID号
Josh McCloud,思科在新加坡有一些伟大的国家网络安全官网络安全提示网上。或者你可以探索更深入的主题参加思科网络学院是免费的网络安全概论当然,旨在提供网络安全意识。
如果你像我一样,对你周围的世界感到好奇,对解决问题感兴趣,所有收集的数据代表了一个巨大的机会来改善社区和组织在全球各个角落。
有什么伟大的科学数据?
数据科学概论是一个引物从思科网络学院课程,自己和学习的一个科学家小组发展到允许任何人把脚弄湿在科学领域的数据。你可以了解数据科学在高度和直观和互动的方式免费在我们的“尝试”技能学习平台。
数据科学在许多方面影响着我们的生活:
- 在娱乐产业中,数据科学负责分类算法,帮助观众找到他们喜欢的视频。根据他们的个人资料,包括视频他们看过,和其他客户提供类似的味道了,算法提供建议。
- 健身应用程序在你的智能手机,或健身追踪、收集数据送入一个应用程序,这个应用程序可以为您提供有价值的健康信息。计算需要多少步骤在一天或你走的距离,这些应用程序必须建立一个模型来确定什么是你的运动迈出一步,距离你覆盖每一个。一些健身追踪者甚至使用自主学习人工智能(AI)软件可以识别并适应各种各样的运动,能够学习新的健身活动基于重复,循环模式。
- 在农业、农民使用手机为研究人员提供植物病害的图像。这些图像在图像识别系统用于诊断疾病,并结合环境数据回归,然后使用算法预测未来爆发。
- 在医学,研究人员已经开发出一种机器学习模型,使用概率对乳腺癌通过检查医疗组织病理学图像进行分类。这种方法可能最终能够检测癌症亚型和良性和恶性组织分类。
数据科学是一种强大的工具,而这些只是几个例子的应用程序。表面上看,数据隐私的成本可能是一个障碍数据科学可以带来潜在的进步。然而,数据隐私给数据科学家社会许可以负责任的方式使用这个工具。每个人都赢了。
查看原始内容在这里。