Datawhale Pandas 打卡-Task_Special

Ex1

首先读入2张表



这两张表的证券代码和日期字段不一致,先整成一样的。



最后根据给出的故公式定义下熵函数。将2张表连接起来之后再使用apply调用熵函数计算。

第二题没整出来 随后再慢慢想吧

Ex3
  1. 有多少县满足总投票数超过县人口数的一半。
    我的思路是这样的:
    (1)读入president_county_candidate表。读入country_population表。发现2张表的县的名称表述不一致。我们需将其转化为一致的。




    (2) 建立字典,键为县名,值为人口数。



    (3)从投票表中取出州名和投票数字段,建立字典。遍历字典,若投票数大于人口数的1/2,结果加一,得到有1040个县满足总投票数超过县人口数的一半。
  2. 把州(state)作为行索引,把投票候选人作为列名,列名的顺序按照候选人在全美的总票数由高到低排序,行列对应的元素为该候选人在该州获得的总票数。
    首先 , 长表变宽表,然后按题目要求排个序。


  3. 每一个州下设若干县,定义拜登在该县的得票率减去川普在该县的得票率为该县的BT指标,若某个州所有县BT指标的中位数大于0,则称该州为Biden State,请找出所有的Biden State。
    这道题也不会写

你可能感兴趣的:(Datawhale Pandas 打卡-Task_Special)