1.没有ack : kafkaspout id 重复导致每次读最新没有数据。
2.由于storm提供的读取kafka的enternal工具存在bug,导致重复读取数据,致使数据不准确。storm bug标号:[storm-643] (0.9.5,之后已修复)
3.storm-netty 连接失败导致的数据丢失或不读. storm bug标号 :[storm-973] (0.9.5,之后已修复)
4.redis集群方法不写导致读取不全
5.redis性能问题,redis写瓶颈 (参照 http://blog.csdn.net/jsky_studio/article/details/48107025)
解决:减小redis访问次数,数据先存于内存(map用线程安全类concurrentHashmap),定期定量存
未完待续......