学习数据科学时,一天学一点SQL还是No-SQL?
熟悉数据库的人都知道,SQL是关系型数据库的编程语言,而No-SQL则是用于存储非结构化数据的非关系型数据库。
什么是关系型数据库?关系型数据库是一种专门用于存储结构化数据的数据库产品。
·关系型数据可以理解为以表格的形式组织的数据。大家都使用过Office或WPS等办公软件,它们提供了表格处理功能。例如,用Excel可以将美职棒大联盟球员的数据以表格的形式组织起来,并将第一行设置为表头。
·使用Pandas对数据进行同样的操作时,也需要添加表头并打印出来。这里的竖列是表的定义,横列则是一行行的数据。
·非关系型数据库是为了解决半结构化数据或非结构化数据存储的问题而出现的。在Python中,dic是一种数据类型,它的key可以是字符串,而值可以是任何嵌套的数据类型,这与No-SQL中的键值和key-value类型非常相似。
·非关系型数据库还有文档、column family、图等其他类型,我们在这里就不一一介绍了。在数据科学中,我们可能会处理各种形式的数据,既包括关系型数据也包括非关系型数据。
然而,从我们学习数据科学的角度来看,关系型数据更为重要。因为Pandas是一种重要的数据科学处理工具,它专门用于处理关系型数据或表格数据。了解SQL的一定程度有助于后续的学习。
因此,我将在下几期内容中简单介绍或复习SQL的相关知识。今天的内容就到这里,和我一起学习机器学习了吗?
点赞、关注、评论,机器学习了吗?