1 2 3 456 / 6 页下一页

软中断在多核cpu上的负载均衡 [复制链接]

platinum

广告杀手

论坛徽章:: 0

发表于 2010-07-21 09:59 |显示全部楼层

不是呀，我说的是google那个补丁，它在队列层放下截获数据包，根据skb的hash值，将skb较均匀地重新调度 ...
独孤九贱发表于 2010-07-21 09:32

它是否可以保证相同的 connection 分配在相同的 CPU 上？如果不能保证，那么是否可能会产生乱序现象？

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

Godbach

版主

论坛徽章:: 36

发表于 2010-07-21 10:10 |显示全部楼层

它是否可以保证相同的 connection 分配在相同的 CPU 上？如果不能保证，那么是否可能会产生乱序现象？
platinum 发表于 2010-07-21 09:59

对，还是需要看一下补丁是否解决TCP保序的问题

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

wzhuzhu

稍有积蓄

论坛徽章:: 0

发表于 2010-07-21 10:13 |显示全部楼层

我在Atom的机器应用了这个补丁，并进行测试。性能没有patch得到的效果那样，没有什么改变。
我是Atom 330的CPU，内核是2.6.32，网卡是82574L，驱动是e1000.sf.net上下载的1.2.8，没有使用NAPI。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

platinum

广告杀手

论坛徽章:: 0

发表于 2010-07-21 10:14 |显示全部楼层

对，还是需要看一下补丁是否解决TCP保序的问题
Godbach 发表于 2010-07-21 10:10

我觉得不仅是 TCP，其实 UDP 也是一样的，只不过处理端在客户系统上，如果乱许，根据 application 的处理，一样会重传的

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

wzhuzhu

稍有积蓄

论坛徽章:: 0

发表于 2010-07-21 10:17 |显示全部楼层

我观察了一下hi集中到了一个CPU上，然后si在第2个CPU上。第一个CPU上基本上没有si。
我改天找一个4核的CPU在我G41的主板上测试一下。看看效果。
谢谢！

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

Godbach

版主

论坛徽章:: 36

发表于 2010-07-21 10:17 |显示全部楼层

也就是如果网卡只是简单的根据一些算法将中断均衡到多核CPU上，但是不考虑connection的话，效果也不好说

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

openspace

小富即安

论坛徽章:: 1

发表于 2010-07-21 10:34 |显示全部楼层

有个irqbalance
http://linux.chinaunix.net/techd ... /02/08/950103.shtml

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

kgn28

家境小康

论坛徽章:: 0

发表于 2010-07-21 15:45 |显示全部楼层

回复 47# openspace

人家讨论的是软中断的均衡{:3_180:}

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

独孤九贱

富足长乐

论坛徽章:: 0

发表于 2010-07-21 17:17 |显示全部楼层

它是否可以保证相同的 connection 分配在相同的 CPU 上？如果不能保证，那么是否可能会产生乱序现象？
platinum 发表于 2010-07-21 09:59

不会乱序，使用对skb进行hash的方法，保证了不会乱序，不过，作者说样会导致CPU 缓存不命中，带来一定的性能形销，解决方法是，同时支持硬件hash，以达到加速的目的。（我现在还没有搞懂，网卡如何利用之）。
以下代码是计算hash并找到与之对应的CPU:

+static int get_rps_cpu(struct net_device *dev, struct sk_buff *skb)
+{
+ struct ipv6hdr *ip6;
+ struct iphdr *ip;
+ struct netdev_rx_queue *rxqueue;
+ struct rps_map *map;
+ int cpu = -1;
+ u8 ip_proto;
+ u32 addr1, addr2, ports, ihl;
+
+ rcu_read_lock();
+
+ if (skb_rx_queue_recorded(skb)) {
+ u16 index = skb_get_rx_queue(skb);
+ if (unlikely(index >= dev->num_rx_queues)) {
+ if (net_ratelimit()) {
+ WARN(1, "Received packet on %s for queue %u, "
+ "but number of RX queues is %u\n",
+ dev->name, index, dev->num_rx_queues);
+ }
+ goto done;
+ }
+ rxqueue = dev->_rx + index;
+ } else
+ rxqueue = dev->_rx;
+
+ if (!rxqueue->rps_map)
+ goto done;
+
+ if (skb->rxhash)
+ goto got_hash; /* Skip hash computation on packet header */
+
+ switch (skb->protocol) {
+ case __constant_htons(ETH_P_IP):
+ if (!pskb_may_pull(skb, sizeof(*ip)))
+ goto done;
+
+ ip = (struct iphdr *) skb->data;
+ ip_proto = ip->protocol;
+ addr1 = ip->saddr;
+ addr2 = ip->daddr;
+ ihl = ip->ihl;
+ break;
+ case __constant_htons(ETH_P_IPV6):
+ if (!pskb_may_pull(skb, sizeof(*ip6)))
+ goto done;
+
+ ip6 = (struct ipv6hdr *) skb->data;
+ ip_proto = ip6->nexthdr;
+ addr1 = ip6->saddr.s6_addr32[3];
+ addr2 = ip6->daddr.s6_addr32[3];
+ ihl = (40 >> 2);
+ break;
+ default:
+ goto done;
+ }
+ ports = 0;
+ switch (ip_proto) {
+ case IPPROTO_TCP:
+ case IPPROTO_UDP:
+ case IPPROTO_DCCP:
+ case IPPROTO_ESP:
+ case IPPROTO_AH:
+ case IPPROTO_SCTP:
+ case IPPROTO_UDPLITE:
+ if (pskb_may_pull(skb, (ihl * 4) + 4))
+ ports = *((u32 *) (skb->data + (ihl * 4)));
+ break;
+
+ default:
+ break;
+ }
+
+ skb->rxhash = jhash_3words(addr1, addr2, ports, hashrnd);
+ if (!skb->rxhash)
+ skb->rxhash = 1;
+
+got_hash:
+ map = rcu_dereference(rxqueue->rps_map);
+ if (map) {
+ u16 tcpu = map->cpus[((u64) skb->rxhash * map->len) >> 32];
+
+ if (cpu_online(tcpu)) {
+ cpu = tcpu;
+ goto done;
+ }
+ }
+
+done:
+ rcu_read_unlock();
+ return cpu;
+}

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

platinum

广告杀手

论坛徽章:: 0

发表于 2010-07-21 17:23 |显示全部楼层

不会乱序，使用对skb进行hash的方法，保证了不会乱序，不过，作者说样会导致CPU 缓存不命中，带来一定 ...
独孤九贱发表于 2010-07-21 17:17

这个 hashkey 取的真妙！既保证了同一个连接可以得出一个 key 值，又利用了不同传输层 port 部分结构相同的特点提高了工作效率
赞一个！

至于九贱兄说的硬件实现的问题继续关注

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

1 2 3 456 / 6 页下一页

返回列表

Chinaunix › 论坛 › 程序设计 › 内核源码 › 软中断在多核cpu上的负载均衡