- 论坛徽章:
- 0
|
我想在新浪财经上用BeautifulSoup抓取资产负债表具体数值,然后将数据导入到SAE的数据库该怎么做?
PS:我遇到的主要问题是BeautifulSoup抓取出现中文乱码,以及表格数值不知道如何进行有效抓取(用re还是BeautifulSoup里面的语言),
比如<tr><td style='padding-left:30px' width='150px'><a target='_blank' href='/corp/view/vFD_FinanceSummaryHistory.php?stockid=002024&type=cbsheet1'>货币资金</a></td><td style='text-align:right;'>24,804,000,000.00</td><td style='text-align:right;'>30,067,400,000.00</td><td style='text-align:right;'>25,474,400,000.00</td><td style='text-align:right;'>19,661,600,000.00</td><td style='text-align:right;'>20,548,900,000.00</td></tr>
还有就是赋值之后如何将它导入到SAE数据库,比如hbzj(货币资金)=20,548,900,000.00,
然后怎样把它导入到SAE自带的mySQL里面 |
|