点击关注我哦
一篇文章带你了解机器学习所需的Python基础知识
Python是数据科学、机器学习和深度学习方向最佳编程选择之一。其为完成每个任务提供了多种选择;易于访问;并且是使用入门的最佳方法之一:因为它使用起来既简单又容易学习;它还拥有一个不断更新和升级的强大社区。
本文假定读者具有一些的编程知识,并且了解一些python。仅对python有一个基本的了解,就可以继续对机器学习的所有扩展和库进行更多了解和学习。
本文讲解的主要内容:
今天,我们将了解python的各种数据结构,然后继续更深入地研究机器学习所需的所有库。我们将通过学习一些简单的代码示例,以更好地理解这些库和功能。
Python中的数据结构:
数据结构是数据元素以某种方式结构化的集合。
下面将讲述python中常见的数据结构。
1. list列表
列表是元素的可变有序序列。可变意味着可以修改或更改列表。
列表创建方法:用[] 创建列表
列表主要功能有:“ append”(用于向列表中添加元素),“ len”函数(用于查找列表的长度)和“ sort(排序)”函数以进行排列列表中的元素以升序排列。这3个通常是最常用的功能,将用于列表。列表切片是另一个非常有用的概念。列表元素可以通过其索引号进行寻址。第0个索引由第一个元素组成,第一个索引由第二个元素组成,依此类推。
关于列表的另一个重要概念是列表理解。通过提供创建列表的简洁方法,此代码可用于简化代码。可以创建一个最多10个正方形的示例,如下所示:
sq = [i ** 2 for i in range(10)]
print(sq)
运行结果为:[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
我们还可以在称为嵌套列表的列表中创建列表。这些通常有助于机器学习中的矩阵运算。
2. map字典
字典是项目的无序集合。与列表和其他数据结构(如元组或集合)不同,字典数据结构具有一对称为键和值的元素。
字典创建方法:用dict函数或{}创建
定义字典后,主要具有三个功能-项功能可查看字典的键和值,键功能可访问字典的键和值功能用于访问各个键的所有值。字典功能甚至可以用于为pandas构建数据框。它是列表旁边最重要的数据结构之一。下面的示例显示如何声明字典并访问字典中的所有变量。
dictionary = {'1': 'Apple',
'2': 'Oranges',
'3': 'Grapes'}
print("The items are: ", dictionary.items())
print("The keys are: ", dictionary.keys())
print("The values are: ", dictionary.values())
运行结果为:
The items are: dict_items([('1', 'Apple'), ('2': 'Oranges'), ('3': 'Grapes')])
The keys are: dict_keys(['1', '2', '3'])
The values are: dict_values(['Apple', 'Oranges', 'Grapes'])
3. tuple元组
元组数据结构类似于列表数据结构,在列表数据结构中,可以定义具有固定数量元素的元组。唯一的区别是元组是不可变的。这样可以防止对元组中的元素进行任何修改,因此无法从创建的特定元组中追加或删除更多元素。
元组创建方法:用()创建元组
访问元组中元素的过程可以通过访问类似于列表的特定索引位置来完成。也可以创建嵌套的元组,即元组内的元素元组。元组数据结构的主要优点在于,它适合于在图形上定义(X,Y)点,以使这些点在整个程序中保持一致,并且不能更改。让我们看一个嵌套元组的示例,主元组包含另外两个((x1,y1))和(x2,y2)形式的元组。让我们看看如何精确地访问元组的y1元素,如下面的代码块所示:
4. set集合
集合是无序元素的集合。这些元素也未索引。
集合创建方法:用set函数 或 {}创建
集合数据结构是可变的,因为可以添加或删除元素,但是集合仅包含每个元素之一。元素的重复项不能在集合中重复,并且集合始终按排序顺序。排序从最小到最大(即升序)进行。集合可用于执行数学集合操作,例如并集,交集,对称差等。下面的代码块显示了集合的简单工作。
s1 = {1, 3, 4, 5, 2, 7}
print(s1)
运行结果为:{1, 3, 4, 5, 2, 7}
5. 字符串
字符串可以用单引号“”或双引号“”定义。字符串是字符的不可变序列。计算机不处理字符。相反,它们处理数字,尤其是二进制数字。即使您可能在屏幕上看到字符,它在内部也被存储和处理为0和1的组合。字符到数字的这种转换称为编码,相反的过程是解码。美国信息交换标准码(ASCII)和Unicode是一些常用的编码。在Python中,字符串是Unicode字符序列。字符串用于编码的常用格式设置技术是UTF-8标准,以字节表示。
· END ·
HAPPY LIFE