- 论坛徽章:
- 4
|
- In [1]: s = '''
- ...: 空调 牌子 哪个 好
- ...: 空调 牌子
- ...: 牌子 空调
- ...: 海尔 压缩空调 维修
- ...: 海尔 空调 多少钱
- ...: 多少钱 海尔 空调
- ...: '''
- In [2]: ss = [set(i.split()) for i in s.split('\n')]
- In [3]: ss
- Out[3]:
- [set(),
- {'哪个', '好', '牌子', '空调'},
- {'牌子', '空调'},
- {'牌子', '空调'},
- {'压缩空调', '海尔', '维修'},
- {'多少钱', '海尔', '空调'},
- {'多少钱', '海尔', '空调'},
- set()]
- In [4]: ss.remove(set())
- In [5]: ss.remove(set())
- In [6]: ss
- Out[6]:
- [{'哪个', '好', '牌子', '空调'},
- {'牌子', '空调'},
- {'牌子', '空调'},
- {'压缩空调', '海尔', '维修'},
- {'多少钱', '海尔', '空调'},
- {'多少钱', '海尔', '空调'}]
- In [7]: [ss[i] for i in range(len(ss)) if ss[i] not in ss[:i]]
- Out[7]:
- [{'哪个', '好', '牌子', '空调'},
- {'牌子', '空调'},
- {'压缩空调', '海尔', '维修'},
- {'多少钱', '海尔', '空调'}]
- In [8]:
复制代码 |
|