java8 Stream大数据量List分批处理切割方式
作者:zhaoyang10 发布时间:2023-02-10 22:34:36
标签:java8,Stream,List,大数据,切割
java8 Stream大数据量List分批处理
//按每3个一组分割
private static final Integer MAX_NUMBER = 3;
/**
* 计算切分次数
*/
private static Integer countStep(Integer size) {
return (size + MAX_NUMBER - 1) / MAX_NUMBER;
}
public static void main(String[] args) {
List<Integer> list = Arrays.asList(1, 2, 3, 4, 5, 6, 7);
int limit = countStep(list.size());
//方法一:使用流遍历操作
List<List<Integer>> mglist = new ArrayList<>();
Stream.iterate(0, n -> n + 1).limit(limit).forEach(i -> {
mglist.add(list.stream().skip(i * MAX_NUMBER).limit(MAX_NUMBER).collect(Collectors.toList()));
});
System.out.println(mglist);
//方法二:获取分割后的集合
List<List<Integer>> splitList = Stream.iterate(0, n -> n + 1).limit(limit).parallel().map(a -> list.stream().skip(a * MAX_NUMBER).limit(MAX_NUMBER).parallel().collect(Collectors.toList())).collect(Collectors.toList());
System.out.println(splitList);
}
使用google guava对List进行分割
//使用guava对list进行分割
List<User> users = userService.findAll();
//按每50个一组分割
List<List<User>> parts = Lists.partition(users, 50);
parts.stream().forEach(list -> {
process(list);
});
使用apache common collection
List<Integer> intList = Lists.newArrayList(1, 2, 3, 4, 5, 6, 7, 8);
List<List<Integer>> subs = ListUtils.partition(intList, 3);
java 手写将一个List等分成n个list
public static <T> List<List<T>> averageAssign(List<T> source, int n) {
List<List<T>> result = new ArrayList<>();
//(先计算出余数)
int remainder = source.size() % n;
//然后是商
int number = source.size() / n;
//偏移量
int offset = 0;
for (int i = 0; i < n; i++) {
List<T> value;
if (remainder > 0) {
value = source.subList(i * number + offset, (i + 1) * number + offset + 1);
remainder--;
offset++;
} else {
value = source.subList(i * number + offset, (i + 1) * number + offset);
}
result.add(value);
}
return result;
}
java8部分特性及list的常见操作
主要记录如何使用Java8中的流式处理,简洁的处理各种常见的操作。
注意:
数组转集合,体现的是适配器模式,只是转换接口,后台的数据仍是数组。所以使用集合相关的操作add、remove、clear会抛异常:UNSupportOperationException。
List<String> list = Arrays.asList("官僚","买办","资产阶级");
集合转数组,不能直接使用无参toArray()方法,该方法返回的是Object[],若强转可能会存在转换异常。带参的大小,必须要跟集合list保持一致,否则会涉及重新分配内存。
Lambda表达式
格式(params) -> {expression}
比如我们实现一个Runnable接口
Runnable run = new Runnable() {
@Override
public void run() {
// TODO
}
}
使用Lambda表达式:Runnable run = () -> {# TODO}
函数式接口,规范:
接口中只能有一个抽象方法
(可选)在接口上添加@FunctionalInterface注解,这样可以检验它是否一个函数式接口
比如:
@FunctionalInterface
public interface MyFun {
void fun();
}
//也可以使用泛型
@FunctionalInterface
public interface MyFun1<T> {
void fun(T t);
}
使用的时候
public static void domething(MyFun myfun) {
myfun.fun();
}
public static void domething(MyFun1<User> myFun) {
User user = new User();
user.setName("我是泛型");
myFun.fun(user);
}
public static void main(String[] args) {
domething(() -> {System.out.println("通过lambda表达式执行了函数式接口");});
domething1((item) -> {
item.setId(100);
item.setAge(20);
System.out.println("这是MyFun1函数式接口真正的执行逻辑,最终的结果是:" + JsonObject.toJsonString(item);)
});
}
常见的list操作
/**
* 数组转集合,体现的是适配器模式,只是转换接口,后台的数据仍是数组。
* 所以使用集合相关的操作add/remove/clear会抛错:unSupportOperationException
*
*/
List<String> arrList = Arrays.asList("买办", "资产阶级", "官僚");
/**
* 集合转数组,不能直接使用无参toArray()方法,该方法的返回类型是Object[],若强转,可能存在转换异常
* 带参的大小,必须要跟集合list保持一致,否则会涉及内存的重新分配
*/
List<String> list = new ArrayList<>();
list.add("买办");
list.add("官僚");
list.add("资产阶级");
// 注意:大小必须和list保持一致,若小于3,则需要重新分配内存地址,并返回新数组地址;
// 若数组元素大于所需,则下标为[list.size()]的元素置为null,其他元素为原值
// 所以最好将数组大小跟集合大小保持一致,可以验证new String[1],new String[5]的输出值
String[] arr = new String[list.size()];
arr = list.toArray(arr);
System.out.println("arr :" + Arrays.toString(arr));
// list 初始化(guava)
List<String> initList = Lists.newArrayList("Java", "Python", "Javascript");
List<User> students = new ArrayList<>();
User st1 = new User();
st1.setId(123);
st1.setAge(10);
User st2 = new User();
st2.setId(123);
st2.setAge(20);
User st3 = new User();
st3.setId(456);
st3.setAge(20);
students.add(st1);
students.add(st2);
students.add(st3);
// list 分割(guava)
List<List<User>> splits = Lists.partition(students, 2);
System.out.println("list分割:" + JsonUtil.toJSONString(splits));
// list分组
Map<Integer, List<User>> groupStu = students.stream().collect(
Collectors.groupingBy(User::getAge));
System.out.println("list分组:" + JsonUtil.toJSONString(groupStu));
// list转map, (k,v),若集合中有重复的key,会抛异常:Duplicate key……
// 通过(k1, k2)->k1来处理重复情况,保留k1,舍弃k2
Map<Integer, Integer> studentIdMap = students.stream().collect(
Collectors.toMap(User::getId, User::getAge, (k1, k2) -> k1));
System.out.println("list转map, (k,v) :" + studentIdMap);
// list转map, (k,t)
Map<Integer, User> studenteMap = students.stream().collect(
Collectors.toMap(User::getId, Function.identity(), (k1, k2) -> k1));
System.out.println("list转map, (k,t) :" + studenteMap);
// list过滤
List<User> oldStu = students.stream().filter(
student -> student.getAge() > 10).collect(Collectors.toList());
System.out.println("list过滤filter :" + JsonUtil.toJSONString(oldStu));
// list对象转换
List<Teacher> teachers = students.stream().map(
student -> {
Teacher teacher = new Teacher();
BeanUtils.copyProperties(student, teacher);
teacher.setTitle("教师");
return teacher;
}).collect(Collectors.toList());
System.out.println("list对象转化:" + JsonUtil.toJSONString(teachers));
// list转set
Set<Integer> ages = students.stream().map(User::getAge).collect(Collectors.toSet());
System.out.println("list转set:" + ages);
// 过滤掉空元素后再map
public static void main(String[] args) {
List<Customer> customerList = new ArrayList<>();
customerList.add(new Customer(1L, "Ryu"));
customerList.add(new Customer(2L, "Ken"));
customerList.add(new Customer(3L, null));
customerList.add(null);
customerList.add(new Customer(5L, null));
customerList.add(new Customer(6L, "Zangief"));
List<String> nameList1 = customerList.stream()
.filter(Objects::nonNull) // 過濾掉Customer為null的元素
.map(e -> e.getName())
.filter(Objects::nonNull) // 過濾掉Customer.getName()為null的元素
.collect(Collectors.toList());
System.out.println(nameList1); // [Ryu, Ken, Zangief]
}
来源:https://blog.csdn.net/fzy629442466/article/details/84765070


猜你喜欢
- C# 3.0为你提供了对象集合初始化器:/// <summary>/// 图书类/// </summary>publ
- windows xp下配置JDK环境变量:1.安装JDK,安装过程中可以自定义安装目录等信息,例如我们选择安装目录为D:/java/jdk1
- Java中存在着两种Random函数:java.lang.Math.Random;调用这个Math.Random()函数能够返回带正号的do
- 杂语:看了很多程序猿都有写博客的习惯,看来我也得练练,不管写的好不好了,学到点什么体会就写写吧。内容解说:这几天开始学游戏地图制作,今天小小
- 在android中,照相功能系统已经提供,在app中可以直接使用。当手机从android play里面下载有照相功能的应用时, 会判断手机是
- maven运行依赖于 JAVA_HOME如果各位还没有配置 JAVA_HOME,可以参考我的另一篇博客 JDK环境变量配置 JDK 环境变量
- java中不定长参数的使用方法不定长参数方法的语法如下:返回值 方法名(参数类型...参数名称)在参数列表中使用“...”形式定义不定长参数
- 二分法查找,顾名思义就是要将数据每次都分成两份然后再去找到你想要的数据,我们可以这样去想,二分法查找很类似与我们平时玩的猜价格游戏,当你报出
- 前言本文主要给大家介绍了关于Spring4自定义@Value功能的相关内容,使用的Spring版本4.3.10.RELEASE,下面话不多说
- java 使用DecimalFormat进行数字的格式化实例详解简单实例://获取DecimalFormat的方法DecimalFormat
- 本文实例为大家分享了Android仿qq分组管理的第三方库,供大家参考,具体内容如下下面先看效果 我们点击展开与折叠分组的功能在库
- volatile对 volatile的理解volatile 是一种轻量级的同步机制。保证数据可见性不保证原子性禁止指令重排序JMMJMM(J
- 1.1、获取http请求参数是一种刚需我想有的小伙伴肯定有过获取http请求的需要,比如想前置获取参数,统计请求数据做服务的接口签名校验敏感
- 一:JDBCTemplate简介Spring为各种持久化技术提供了简单操作的模板和回调API:ORM持久化技术模板类原生JDBCorg.sp
- Java java.lang.ExceptionInInitializerError 错误如何解决引起 Java.lang.Ex
- 假设有两个线程在并发运行,一个线程执行的代码中含有一个死循环如:while(true)....当该线程在执行while(true)中代码时,
- 快速入门在Spring Boot的工程中的pom.xml中引入spring-boot-starter-mail依赖:<dependen
- 本文实例为大家分享了Android弹性滑动类Scroller的具体代码,供大家参考,具体内容如下Scroller是什么 Scroller就是
- 前言本文主要给大家介绍的是java虚拟机的故障处理工具,文中提到这些工具包括:名称主要作用jpsJVM process Status Too
- 主要实现的功能:1.程序附带多张拼图随机拼图。2.可手动添加拼图。3.游戏成功判断。4.30秒超时判断。 Puzzle.csus