1 python数据分析之前奏

1.1 Python基本语法

Python使用Python使用<变量名>=<表达式>的方式对变量进行赋值

a=1
a
s = 'hello world'
s

(1)数据类型

字符串

字符串的定义是使用引号来定义,单引号与双引号是等价的

s='hello world'
s

三引号用来输入包含多行文字的字符串(可以是单引号也可以是双引号)

s='''hello
			my
			world'''
print(s)
hello
my
world

字符串的加法

s="hello "+"worrld"
s
'hello worrld'

字符串索引(索引号从0开始)

s[1]
'e'

字符串的分割(spilt方法,可以按照自己指定的方法分割,默认是空格)

s="hello world"
s.split()
['hello', 'world']
s="hello,world"
s.split(",")
['hello', 'world']

查看字符串的长度

len(s)
11

整数

b=100
b
100

浮点数

c=3.8
c
3.8

布尔值

a=True
a
True
a=1>2
a
False

空值

a=''
a
''
len(a)
0
a = None
a

运算符

运算符:http://www.runoob.com/python/python-operators.html#ysf4

基本运算

2**3 #幂运算
8
9%2 #取余运算
1
9//2 #取整除-返回商的整数部分
4

比较运算

1 != 2#2 <> 2 #都是不等于的写法,貌似后面这个在3以后的版本里就不支持了
True
1>2
False
3==3 #等式两边比较
True

赋值运算

a=2a*=3 #a=a*3a
6

逻辑运算

&-and,a&b只有当ab都是True的时候,结果才是True,否则都是False

a=Trueb=Falsea&b
False
a=3>2b=4>3a&b
True

|-or,a|b,当ab有一个为True的时候,结果就是True,两个都是False的时候结果才是False (注意或运算有短路的现象,左边表达式成立的话右边将不会执行)

a=1>2b=4>3a|b
True

not 取反

not a
False

(2)数据结构

列表List

Python用[]来生成列表,也可以用list关键字

a=[1,2,3,4,5]a
[1, 2, 3, 4, 5]
actors=['周迅','章子怡','赵薇']actors
['周迅', '章子怡', '赵薇']
b=[1,2.3,'a','b']b #列表中的元素允许各个元素不一样
[1, 2.3, 'a', 'b']
list('abcde') #利用list生成列表
['a', 'b', 'c', 'd', 'e']

列表操作

a+b #将两个链表链接在一起
[1, 2, 3, 4, 5, 1, 2.3, 'a', 'b']
a[0] #索引号,从0开始
[1, 2, 3, 4, 5, 6]
a.append(6) #append方法,在末尾增加一个数a
[1, 2, 3, 4, 5, 6]
a.insert(1,10) #insert方法,索引号,值a
[1, 10, 2, 3, 4, 5, 6]
a.pop() #pop方法,默认是删除最后一个元素,在里面写数字的话是写索引号a
[1, 10, 2, 3, 4, 5]
a.pop(1)a
[1, 2, 3, 4, 5]
a[0:3] #数据切片,左闭右开区间a[-1] #-1表示倒数第一个数a[-3:-1] #负索引切片a[:3]a[-3:] #不写的话默认从左边第一个开始或者取到右边最后一个
[3, 4, 5]