1 ... 11 12 13 141516 17 18 19 ... 22 / 22 页下一页

[算法] c语言怎么实现分隔 [复制链接]

Fixend

丰衣足食

论坛徽章:: 0

141楼 [报告]

发表于 2014-08-25 21:55 |只看该作者

我也贴个C++的。

#ifdef _MSC_VER
#define _SCL_SECURE_NO_WARNINGS 1
#endif
#include <string>
#include <vector>
#include <iostream>
#include <fstream>
#include <boost/foreach.hpp>
#include <boost/lexical_cast.hpp>
#include <boost/algorithm/string.hpp>
// 对应一行的数据
typedef std::vector<int> ResultLineType;
// 所有的行
typedef std::vector<ResultLineType> ResultVectorType;
// 打印结果
void print_result(const ResultVectorType &result_vec)
{
std::cout << "total line: " << result_vec.size() << std::endl;
// 一行一行的输出
for (size_t m = 0; m < result_vec.size(); ++m)
{
const ResultLineType &line_vec = result_vec[m];
// 输出行号，空行也输出行号
std::cout << "line" << m + 1 << ":\t";
if (line_vec.empty())
{
std::cout << std::endl;
continue;
}
// 遍历一行中的各个数值
for (size_t n = 0; n < line_vec.size(); ++n)
{
std::cout << line_vec[n];
if (n == line_vec.size() - 1)
std::cout << std::endl;
else
std::cout << " ";
}
}
}
// ifs 输入
// result_vec 结果
int parse_stream(std::ifstream &ifs, ResultVectorType &result_vec)
{
// 行数，从1开始
int line_count = 0;
// 读到的一行字符串
std::string line;
// 字符串去除逗号和空白后的字符串结果集合
std::vector<std::string> split_vec;
// 从split_vec转换成的整数结果集合
ResultLineType result_line;
// 每次处理一行
for (;;)
{
std::getline(ifs, line);
if (!ifs.good())
break;
++line_count;
split_vec.clear();
result_line.clear();
// 跳过空行
if (line.empty())
{
result_vec.push_back(result_line);
continue;
}
// 分割字符串
boost::split(split_vec, line, boost::is_any_of(" ,\r\n"), boost::token_compress_on);
try
{
// 转换成整数
BOOST_FOREACH (std::string &str, split_vec)
{
int num = boost::lexical_cast<int>(str);
result_line.push_back(num);
}
// 存入
result_vec.push_back(result_line);
}
catch (const boost::bad_lexical_cast &)
{
// 格式错误则中断处理
std::cerr << "error: file format error, line: " << line_count << std::endl;
return 3;
}
}
return 0;
}
int main(int argc, char **argv)
{
if (argc != 2)
{
std::cerr << "usage: fl <filepath>" << std::endl;
return 1;
}
// 只读方式打开文件
std::ifstream ifs(argv[1], std::ios_base::in);
if (!ifs.good())
{
std::cerr << "error: can not read file." << std::endl;
return 2;
}
ResultVectorType result_vec;
// 处理
int ret = parse_stream(ifs, result_vec);
if (ret == 0)
{
// 打印结果
print_result(result_vec);
}
ifs.close();
return ret;
}

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

noword2k

家境小康

论坛徽章:: 1

142楼 [报告]

发表于 2014-08-26 09:18 |只看该作者

yulihua49 发表于 2014-08-25 15:36
你那个C++函数，很好。
给个建议，文件，就不要给文件名了，直接传fp，这样可以用到stdin，这个可是个重 ...

“如果你认为这个功能很重要，很通用，就把这个函数加到你的应用工具库，以后，在有需要时，一行语句就解决问题。”
按照你的这条理由，汇编也适用吧，你为什么不用汇编来写呢？

代码量的多少，怎么就与适合不适合没有关系呢？
某语言用更少的代码完成同样的工作，我就可以说某语言更适合于这项工作。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

yulihua49

巨富豪门

论坛徽章:: 15

143楼 [报告]

发表于 2014-08-26 09:56 |只看该作者

本帖最后由 yulihua49 于 2014-08-26 10:23 编辑

noword2k 发表于 2014-08-26 09:18
“如果你认为这个功能很重要，很通用，就把这个函数加到你的应用工具库，以后，在有需要时，一行语句就解 ...

处理字符串，汇编，当然是最合适的了，但是它不适合我，也不适合大多数开发者。
X86的汇编指令，有一大堆串指令，可以极大的提高字符串的处理效率。系统中，部分函数使用了这些指令。可惜，C编译器不完全支持这些指令，那些函数就是用汇编写的，我们使用那些系统函数，就间接的使用了汇编。
如：
loop，loopz，loopnz，movs，loop movs ，translat，。。。。。。。
使用这些指令的另一个好处是原子操作，一个核的指令未完成前，其他核是不能访问同样地址的。

strtok（）里就用了一个strchr（）；
这个strchr，在某些gcc的库里就是用汇编写的。
memset，memcpy里边也发现了汇编的串指令。

我说，C，非常适合处理字符串，还有一个原因，C支持汇编，C程序可以和汇编程序无缝连接，如果一个操作，非常的在意运行效率，你就可以写一个汇编函数，供C调用。
这个函数加入到应用工具库里，成为可重用代码。
缺点是，这个函数不可移植，如果你想在别的CPU上使用，就要按照那个CPU的指令重写。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

yulihua49

巨富豪门

论坛徽章:: 15

144楼 [报告]

发表于 2014-08-26 10:07 |只看该作者

cobras 发表于 2014-08-25 16:31
进一步改进版。有超长行警告。

那个read_file_line里边的while完全可以不要。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

fender0107401

版主

论坛徽章:: 89

145楼 [报告]

发表于 2014-08-26 11:02 |只看该作者

yulihua49 发表于 2014-08-26 09:56
处理字符串，汇编，当然是最合适的了，但是它不适合我，也不适合大多数开发者。
X86的汇编指令，有一大堆 ...

处理字符串，汇编，当然是最合适的了，但是它不适合我，也不适合大多数开发者。

即不适合你，也不适合大多数开发者？那还合适个毛线啊？

科普哥，你这是语无伦次了吧？

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

fender0107401

版主

论坛徽章:: 89

146楼 [报告]

发表于 2014-08-26 11:03 |只看该作者

科普哥加油！弟兄们都看着你呢！

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

noword2k

家境小康

论坛徽章:: 1

147楼 [报告]

发表于 2014-08-26 11:14 |只看该作者

yulihua49 发表于 2014-08-26 09:56
处理字符串，汇编，当然是最合适的了，但是它不适合我，也不适合大多数开发者。
X86的汇编指令，有一大堆 ...

“处理字符串，汇编，当然是最合适的了，但是它不适合我，也不适合大多数开发者。”
不觉得这句话自相矛盾吗？汇编适用于处理字符串，但是不适用于“大多数开发者”。这是什么无敌逻辑？

谁告诉你汇编指令就是原子操作的？
https://software.intel.com/zh-cn/blogs/2010/01/14/cpucpu
请看第三小节。

执行效率和适用不适用有个毛关系。
最适用于处理字符串的语言是perl，这个没有异议吧。perl的执行效率比C/C++强了？

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

cobras

小富即安

论坛徽章:: 2

148楼 [报告]

发表于 2014-08-26 13:26 来自手机 |只看该作者

当然要，不要不行。因为将一长行截断处理很大可能结果是错误的。还不如直接跳过。给个警告。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

cobras

小富即安

论坛徽章:: 2

149楼 [报告]

发表于 2014-08-26 13:32 来自手机 |只看该作者

适不适合只是建立在个人能力上的观点。对于同个问题，有人用c一小时解决，用python的两小时。因为他擅长c，用python的查手册。这根代码量多少没太大关系。所以对他来说c就是适合的。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

yulihua49

巨富豪门

论坛徽章:: 15

150楼 [报告]

发表于 2014-08-26 13:35 |只看该作者

本帖最后由 yulihua49 于 2014-08-26 13:47 编辑

fender0107401 发表于 2014-08-26 11:02
即不适合你，也不适合大多数开发者？那还合适个毛线啊？

科普哥，你这是语无伦次了吧？

适合小众，适合系统开发者，他们写了工具，大家用。ok？
我没说perl适不适用。我说C适用。在有些场合，执行效率至关重要。
不说perl适不适用，你能用perl写个g++编译器（这可能问题不大），看看执行效率，就是编译的速度。。。。。。。

某语言，它的程序文本，就是一些个字符串。编译器，就是处理字符串。C适合做编译器，不适合处理字符串？这个，太没有逻辑性了吧？你是否陷入逻辑混乱？
把头脑柃清再发言吧。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

1 ... 11 12 13 141516 17 18 19 ... 22 / 22 页下一页

返回列表

Chinaunix › 论坛 › 程序设计 › C/C++ › c语言怎么实现分隔