1、从数据库获取码表
sql = "select category_id, category_name from tb_category"
category_dict = {x["category_name"]:x["category_id"] for x in queryBySql(sql)}
2、在DF中使用apply添加一列新的ID
df.loc[:, "category_id"] = df.apply(
lambda x : category_dict.get(x["分类"],-1), axis=1
)
这里的axis==1,那么每次遍历的是每个row的Series,这个Series的key是每列的column name.