本帖最后由 abcfy2 于 2017-01-03 21:50 编辑
手头有三个csv文件
file1.csv:
- id,ssn
- 1,aaaa
- 2,bbbb
- 3,cccc
- 4,
复制代码
file2.csv
- timestamp
- 1111111
- 222222
- 444444
复制代码
file3.csv
- ssn,info
- bbbb,infob
- cccc,infoc
- aaaa,infoa
复制代码
要求:
1. 将file2.csv的列全部插入file1.csv的第二列,得到一个file1+2.csv文件file1+2.csv
- id,timestamp,ssn
- 1,11111,aaaa
- 2,22222,bbbb
- 3,,cccc
- 4,4444,
复制代码
2. 得到的结果再和file3.csv按照ssn进行LEFT JOIN操作
得到最终的结果:
- id,timestamp,ssn,info
- 1,111111,aaaa,infoa
- 2,222222,bbbb,infob
- 3,,cccc,infoc
- 4,4444444,,
复制代码
整个过程的SQL描述类似于:
- SELECT file1.id, file2.timestamp, file1.ssn, file3.info FROM file1.csv,file2.csv LEFT JOIN file3.csv ON file1.ssn = file3.ssn;
复制代码
|