夏寿龙
侠客
侠客
  • UID507
  • 粉丝0
  • 关注0
  • 发帖数3
阅读:4738回复:0

大数据文件导出下载

楼主#
更多 发布于:2019-04-25 22:19
在气象搜索业务的时候,常常需要根据客户需求搜索导出大数据量的文件。比如单次超过一百万条数据等情况,此时不论查询还是输出数据到文件中都对系统产生极大负荷,现整理一些常用办法,以便后续使用时候查看。

1. 优化SQL语句。由于查询的原表中可能会有几亿的数据量,此时若采用不考虑性能的SQL语句则会导致查询时间在半小时以上,影响用户体验。方法包括使用建立了索引的列进行查询,减少使用“in”,“*”此类关键字,会导致数据库全表扫描。

2. 分批量查询。列中有连续的字段时候可以采用分批查询插入的方式。例如时间,可以分成一个月一个月的查询插入,减少一次性插入内存的数据过多。

3. 若数据量过大,则可使用定时器将生成文件的过程放到晚上,使白天用户的正常使用不受影响。

4. 使用的文件格式。老版的xls格式(操作类为HSSFWorkbook)的最大数据量为65535行,超过则会报错。新版的xlsx格式(操作类为SXSSFSXSSFWorkbook)的最大数据量为1048576行。若数据量超过上述的两种数据格式外,可使用CSV格式文件。
游客

返回顶部