在这个博客中,我们将讨论的后果Galera去年犯下错误未能报告(中断系统调用)。

我最近看到这个错误与Percona XtraDB集群(或Galera):雷竞技下载官网

[警告]WSREP:去年承诺未能报告549684236,4(中断系统调用)

这是张贴在发射台2013年错误:https://bugs.launchpad.net/雷竞技下载官网percona-xtradb-cluster/ +错误/ 1434646

我的同事Przemek回答,并解释说:

报告最后提交的交易只是一个认证指数清洗过程的一部分。以防它由于某种原因失败时(偶尔),cert指数清洗可能有点延迟。但这并不意味着交易没有成功应用。毕竟这是一个警告。

如果我们查找这个错误的源代码,我们意识到它是重用的Linux系统错误。具体地说:

#定义捕获4 / *中断系统调用* /

没有什么文档关于这个错误,和互联网搜索没有提出有用的信息,我和我的同事大卫·班尼特钻研的源代码(就像我们有时)。

如果我们看看Galera源代码gcs_sm.hpp我们看到:

289 * @retval - eintr——被另一个线程

我们也看到:

317 / *被打断,将由别人* /

这意味着线程被中断,但是在另一个线程服务器将重试。因为它只是一个警告,它不是什么太关心——除非他们开始堆积(它可以是并发问题的迹象)。

具体从抛出警告galera_service_thd.cpp在这里:

58如果(gu_unlikely (ret < 0))
59 {
60 log_warn < <“失败的最后一次提交报告”
61年< <数据。last_committed_ < <”、“< <仓促
62年< <”(“< < strerror (ret) < < ') ';
63 / / @todo:弄清楚在这种情况下该做什么
64}

这个警告可以更好的处理,不是洪水日志,管理员或声音神秘足够关注。

3评论
最古老的
最新的 大多数投票
内联反馈
查看所有评论

使用本地sysbench PXC 5.7,我看到这个消息在硬盘:

2016 - 08 - 09 - t09:43:58.131621z 0[警告]WSREP:去年71年承诺,未能报告4(中断系统调用)
2016 - 08 - 09 - t09:44:01.746062z 0[警告]WSREP:去年承诺未能报告43岁,4(中断系统调用)
2016 - 08 - 09 - t09:44:04.974485z 0[警告]WSREP:去年承诺未能报告45 4(中断系统调用)
2016 - 08 - 09 - t09:44:12.695912z 0[警告]WSREP:去年承诺未能报告51岁,4(中断系统调用)
2016 - 08 - 09 - t09:44:16.046751z 0[警告]WSREP:去年承诺未能报告53岁,4(中断系统调用)

同样不会发生SSD在同一服务器上(否则所有剩余等于)

我没有不同的消息
[警告]WSREP:去年承诺未能报告285293519,-110(连接超时)
这是什么意思?

Krunal Bauskar

这就意味着该节点无法提交报告通知发送给集团可能通道由于大量n / w流量。再次从同一类别也可以忽略,但信号的一个重要的警告,你可能想重新评估你的负载和可用的n / w带宽。没有事情会立即断开但如果事情以这种方式持续增长下降在未来你可以看到节点由于n / w问题。