1.时间不一致引起的问题现象:更新dns在ns2报授权错误add zoo.eos.grid.sina.com.cn A 10.75.10.10 on NS: 10.75.14.72...OKadd zoo.eos.grid.sina.com.cn A 10.75.10.10 on NS: 10.75.14.214...FAIL, NOTAUTH在ns2上查看named错误日志查到/var/log/messageJun 7 11:08:23 leto214 named[30231]: client10.75.14.72#36991: request has invalid signature: TSIG update_key:tsig verify failure(BADTIME)原因:发现报错是时间不一致引起进一步排查发现ns1重启动后ntp服务没有运行,时间有问题,使用ntp校准时间后,问题解决。

2.dns的二进制日志损坏引起的问题:背景:在/var/named/chroot /var/named下有两个重要文件:mars.grid.sina.com.cn.zone.internal;mars.grid.sina.com.cn.zone.internal.jnl前一个文件记录的是本dns的zone文件,后一个文件是dns的二进制日志。现象:Notice: parameter and logic check done,now deal DNSNotice: del 10.55.28.45 of s3377i.mars.grid.sina.com.cn on NS:ns1.mars.grid.sina.com.cn succeedError: del 10.55.28.45 ofs3377i.mars.grid.sina.com.cn on NS: ns2.mars.grid.sina.com.cnfailed, SERVFAIL说明:更新ns1.mars成功,更新ns2.mars失败,报错SERVER FAIL(http://www.process.com/techsupport/multinet/787/44.html)在ns2上查看日志/var/log/message,没有任何报错信息,就是无法更新。解决:通过在named下配置文件named.conf中添加如下代码,打开dns的详细错误日志:
logging { channel default_file { file"/var/log/named.log" size 10m; severitydebug; print-timeyes; print-severity yes; print-category yes; }; category default{default_file; };};捕获到错误信息,并确认jnl损坏。删除损坏的jnl文件,从ns1上拷贝zone文件覆盖本地zone文件,确保数据一致性,重启named。