From 66654dfa89cd2bc33fd0ac226973d191eba614c8 Mon Sep 17 00:00:00 2001
From: Sibylau <jl3952@cornell.edu>
Date: Fri, 5 Jan 2024 23:35:59 -0500
Subject: [PATCH] script

---
 .../CPU/UniSparse/sparlay_bdia_csr_spmv.mlir  | 164 ++++++++++++++++++
 .../UniSparse/unisparse_bdia_csr_spmv.mlir    | 119 +++++++++++++
 .../UniSparse/executables/coo_cisr            | Bin 0 -> 19208 bytes
 .../UniSparse/executables/coo_cisr.o          | Bin 0 -> 6056 bytes
 ...o_to_cisr.mlir => unisparse_coo_cisr.mlir} |   7 -
 evaluation/FormatConversion/coo_cisr.o        | Bin 0 -> 496 bytes
 evaluation/FormatConversion/run.sh            |   5 +
 7 files changed, 288 insertions(+), 7 deletions(-)
 create mode 100644 evaluation/CPU/UniSparse/sparlay_bdia_csr_spmv.mlir
 create mode 100644 evaluation/CPU/UniSparse/unisparse_bdia_csr_spmv.mlir
 create mode 100755 evaluation/FormatConversion/UniSparse/executables/coo_cisr
 create mode 100644 evaluation/FormatConversion/UniSparse/executables/coo_cisr.o
 rename evaluation/FormatConversion/UniSparse/{temp_coo_to_cisr.mlir => unisparse_coo_cisr.mlir} (75%)
 create mode 100644 evaluation/FormatConversion/coo_cisr.o
diff --git a/evaluation/CPU/UniSparse/sparlay_bdia_csr_spmv.mlir b/evaluation/CPU/UniSparse/sparlay_bdia_csr_spmv.mlir
new file mode 100644
index 0000000..06f1be2
--- /dev/null
+++ b/evaluation/CPU/UniSparse/sparlay_bdia_csr_spmv.mlir
@@ -0,0 +1,164 @@
+// sparlay-opt ./decompose-BDIA.mlir -lower-struct-convert -lower-struct -dce -sparlay-codegen -lower-format-conversion | \
+// mlir-opt -one-shot-bufferize="bufferize-function-boundaries=1 allow-return-allocs unknown-type-conversion=identity-layout-map function-boundary-type-conversion=identity-layout-map" \
+// -finalizing-bufferize -convert-linalg-to-loops -convert-vector-to-scf -convert-scf-to-cf -lower-affine \
+// -convert-vector-to-llvm -convert-memref-to-llvm -convert-complex-to-standard -convert-math-to-llvm \
+// -convert-math-to-libm -convert-complex-to-libm -convert-complex-to-llvm -convert-func-to-llvm \
+// -reconcile-unrealized-casts  | mlir-translate -mlir-to-llvmir | opt -O3 -S | llc -O3 -relocation-model=pic -filetype=obj -o bdia_spmv.o
+    
+// clang++ bdia_spmv.o -L$SPLHOME/build/lib -lmlir_sparlay_runner_utils \
+//     -L$LLVMHOME/build/lib -lmlir_runner_utils -lmlir_c_runner_utils -o bdia_spmv
+
+// ./bdia_spmv
+
+// RUN: sparlay-opt %s -lower-struct-convert -lower-struct -dce -lower-format-conversion | FileCheck %s
+
+
+!Filename = !llvm.ptr<i8>
+
+#COO = #sparlay.encoding<{
+  crdMap = #sparlay.crd<(i,j)->(i,j)>,
+  compressMap = #sparlay.compress<trim(0,1)>
+}>
+
+#CSR = #sparlay.encoding<{
+  crdMap = #sparlay.crd<(i,j)->(i,j)>,
+  compressMap = #sparlay.compress<fuse(0), trim(1,1)>
+}>
+
+#BDIA = #sparlay.encoding<{
+  crdMap = #sparlay.crd<(i,j)->(i floordiv 50, j minus i, i mod 50)>,
+  compressMap = #sparlay.compress<fuse(0), trim(1,1)>
+}>
+
+#trait1 = {
+indexing_maps = [
+    affine_map<(i,j) -> (i, j)>,  // A
+    affine_map<(i,j) -> (j)>,  // B
+    affine_map<(i,j) -> (i)>   // X (out)
+  ],
+  iterator_types = ["parallel", "reduction"],
+  doc = "X(i) =+ A(i,j) * B(j)"
+}
+
+module {
+  func.func private @rtclock() -> f64
+  func.func private @getTensorFilename(index) -> (!Filename)
+  func.func @kernel_csr_spmv(%arg0: tensor<?x?xf32, #CSR>, %arg1: tensor<?xf32>, %argx: tensor<?xf32>) -> tensor<?xf32> {
+    %0 = linalg.generic #trait1
+    ins(%arg0, %arg1 : tensor<?x?xf32, #CSR>, tensor<?xf32>)
+    outs(%argx: tensor<?xf32>) {
+    ^bb0(%a: f32, %b: f32, %x: f32):
+      %2 = arith.mulf %a, %b : f32
+      %3 = arith.addf %x, %2 : f32
+      linalg.yield %3 : f32
+    } -> tensor<?xf32>
+    return %0 : tensor<?xf32>
+  }
+
+  func.func @main() {
+    %c0 = arith.constant 0: index
+    %c1 = arith.constant 1 : index
+    %f0 = arith.constant 0.0: f32
+    %f05 = arith.constant 0.5: f32
+    %i1 = arith.constant 1: i32
+    %blockSize = arith.constant 100: i32
+    %thres_1 = arith.constant 0.5: f32
+
+    %fileName = call @getTensorFilename(%c0) : (index) -> (!Filename)
+    %A_1 = sparlay.fromFile (%fileName): !llvm.ptr<i8> to tensor<?x?xf32, #COO>
+    %dim1 = tensor.dim %A_1, %c1 : tensor<?x?xf32, #COO>
+    %dim0 = tensor.dim %A_1, %c0 : tensor<?x?xf32, #COO>
+    // %thres_1 = arith.constant dense<[0.5]>: tensor<1xf32>
+    // %thres_2 = bufferization.alloc_tensor () copy(%thres_1): tensor<1xf32>
+    // %thres = bufferization.to_memref %thres_2: memref<1xf32>
+
+    %t_start0 = call @rtclock() : () -> f64
+    %S_1 = sparlay.decompose_BDIA %A_1, %blockSize, %thres_1 : tensor<?x?xf32, #COO>, i32, f32 to 
+          !sparlay.struct< tensor<?x?xf32,#COO>, tensor<?x?xf32,#BDIA> >
+    %t_end0 = call @rtclock() : () -> f64
+    %t_0 = arith.subf %t_end0, %t_start0: f64
+    vector.print %t_0 : f64
+    
+    %B_0 = sparlay.struct_access %S_1[0]: 
+              !sparlay.struct< tensor<?x?xf32,#COO>, tensor<?x?xf32,#BDIA> >
+          to  tensor<?x?xf32, #COO>
+    %B_1 = sparlay.struct_access %S_1[1]:
+              !sparlay.struct< tensor<?x?xf32,#COO>, tensor<?x?xf32,#BDIA> >
+          to  tensor<?x?xf32, #BDIA>
+
+    %D_0 = sparlay.convert(%B_0) : tensor<?x?xf32, #COO> to tensor<?x?xf32, #CSR>
+    
+    // %init_256_4 = bufferization.alloc_tensor(%dim1) : tensor<?xf32>
+    // %b = scf.for %i = %c0 to %dim1 step %c1 iter_args(%t = %init_256_4) -> tensor<?xf32> {
+    //   %k0 = arith.muli %i, %c1 : index
+    //   %k1 = arith.index_cast %k0 : index to i32
+    //   %k = arith.sitofp %k1 : i32 to f32
+    //   %t3 = tensor.insert %k into %t[%i] : tensor<?xf32>
+    //   scf.yield %t3 : tensor<?xf32>
+    // }
+    %init_256_4 = bufferization.alloc_tensor(%dim1) : tensor<?xf32>
+    // %tensor_B = tensor.insert %f05 into %init_256_4[%c0] : tensor<?xf32>
+    // %dim1_1 = arith.subi %dim1, %c1 : index
+    // %i_dim1_1 = arith.index_cast %dim1_1 : index to i32
+    // %f_dim1_1 = arith.sitofp %i_dim1_1 : i32 to f32
+    // %elm = arith.divf %f05, %f_dim1_1 : f32
+    // %b = scf.for %i = %c1 to %dim1 step %c1 iter_args(%t = %tensor_B) -> tensor<?xf32> {
+    %b = scf.for %i = %c0 to %dim1 step %c1 iter_args(%t = %init_256_4) -> tensor<?xf32> {
+      %k1 = arith.index_cast %i : index to i32
+      %k = arith.sitofp %k1 : i32 to f32
+      %t3 = tensor.insert %k into %t[%i] : tensor<?xf32>
+      scf.yield %t3 : tensor<?xf32>
+    }
+    
+    // %o0 = bufferization.alloc_tensor(%dim0) : tensor<?xf32>
+    // %o00 = scf.for %i = %c0 to %dim0 step %c1 iter_args(%t = %o0) -> tensor<?xf32> {
+    //   %t3 = tensor.insert %f0 into %t[%i] : tensor<?xf32>
+    //   scf.yield %t3 : tensor<?xf32>
+    // }
+    %o1 = bufferization.alloc_tensor(%dim0) : tensor<?xf32>
+    %o11 = scf.for %i = %c0 to %dim0 step %c1 iter_args(%t = %o1) -> tensor<?xf32> {
+      %t3 = tensor.insert %f0 into %t[%i] : tensor<?xf32>
+      scf.yield %t3 : tensor<?xf32>
+    }
+    // %o2 = bufferization.alloc_tensor(%dim0) : tensor<?xf32>
+    // %o22 = scf.for %i = %c0 to %dim0 step %c1 iter_args(%t = %o2) -> tensor<?xf32> {
+    //   %t3 = tensor.insert %f0 into %t[%i] : tensor<?xf32>
+    //   scf.yield %t3 : tensor<?xf32>
+    // }
+    
+    %t_start4 = call @rtclock() : () -> f64
+    // CSR SpMV
+    // %result0 = call @kernel_csr_spmv(%D_0, %b, %o00) : (tensor<?x?xf32, #CSR>, tensor<?xf32>, tensor<?xf32>) -> tensor<?xf32>
+    // %t_end1 = call @rtclock() : () -> f64
+    // block DIA SpMV
+    %result1 = sparlay.bdia_spmv %D_0, %B_1, %b, %o1: 
+      tensor<?x?xf32, #CSR>, tensor<?x?xf32,#BDIA>, tensor<?xf32>, tensor<?xf32> to memref<?xf32>
+    // %t_end2 = call @rtclock() : () -> f64
+    // %output = linalg.elemwise_binary ins(%result0, %result1: tensor<?xf32>, tensor<?xf32>)
+    //                           outs(%o2: tensor<?xf32>) -> tensor<?xf32>
+    %t_end4 = call @rtclock() : () -> f64
+    // %t_1 = arith.subf %t_end1, %t_start4: f64
+    // %t_2 = arith.subf %t_end2, %t_end1: f64
+    // %t_4 = arith.subf %t_end4, %t_end2: f64
+    %t_5 = arith.subf %t_end4, %t_start4: f64
+    // vector.print %t_1 : f64
+    // vector.print %t_2 : f64
+    // vector.print %t_4 : f64
+    vector.print %t_5 : f64
+    // %v0 = vector.transfer_read %result0[%c0], %f0: tensor<?xf32>, vector<4xf32>
+    // vector.print %v0 : vector<4xf32>
+    %v1 = vector.transfer_read %result1[%c0], %f0: memref<?xf32>, vector<4xf32>
+    vector.print %v1 : vector<4xf32>
+    // %v2 = vector.transfer_read %output[%c0], %f0: tensor<?xf32>, vector<4xf32>
+    // vector.print %v2 : vector<4xf32>
+    bufferization.dealloc_tensor %A_1 : tensor<?x?xf32, #COO>
+    bufferization.dealloc_tensor %B_1 : tensor<?x?xf32, #BDIA>
+    sparlay.release %S_1: !sparlay.struct< tensor<?x?xf32,#COO>, tensor<?x?xf32,#BDIA> >
+    // bufferization.dealloc_tensor %B_0 : tensor<?x?xf32, #COO>
+    // bufferization.dealloc_tensor %o1 : tensor<?xf32>
+    // bufferization.dealloc_tensor %result0 : tensor<?xf32>
+    // bufferization.dealloc_tensor %output : tensor<?xf32>
+
+    return
+  }
+}
\ No newline at end of file
diff --git a/evaluation/CPU/UniSparse/unisparse_bdia_csr_spmv.mlir b/evaluation/CPU/UniSparse/unisparse_bdia_csr_spmv.mlir
new file mode 100644
index 0000000..c13b076
--- /dev/null
+++ b/evaluation/CPU/UniSparse/unisparse_bdia_csr_spmv.mlir
@@ -0,0 +1,119 @@
+// sparlay-opt ./decompose-BDIA.mlir -lower-struct-convert -lower-struct -dce -sparlay-codegen -lower-format-conversion | \
+// mlir-opt -one-shot-bufferize="bufferize-function-boundaries=1 allow-return-allocs unknown-type-conversion=identity-layout-map function-boundary-type-conversion=identity-layout-map" \
+// -finalizing-bufferize -convert-linalg-to-loops -convert-vector-to-scf -convert-scf-to-cf -lower-affine \
+// -convert-vector-to-llvm -convert-memref-to-llvm -convert-complex-to-standard -convert-math-to-llvm \
+// -convert-math-to-libm -convert-complex-to-libm -convert-complex-to-llvm -convert-func-to-llvm \
+// -reconcile-unrealized-casts  | mlir-translate -mlir-to-llvmir | opt -O3 -S | llc -O3 -relocation-model=pic -filetype=obj -o bdia_spmv.o
+    
+// clang++ bdia_spmv.o -L$SPLHOME/build/lib -lmlir_sparlay_runner_utils \
+//     -L$LLVMHOME/build/lib -lmlir_runner_utils -lmlir_c_runner_utils -o bdia_spmv
+
+// ./bdia_spmv
+
+// RUN: sparlay-opt %s -lower-struct-convert -lower-struct -dce -lower-format-conversion | FileCheck %s
+
+
+!Filename = !llvm.ptr<i8>
+
+#COO = #sparlay.encoding<{
+  crdMap = #sparlay.crd<(i,j)->(i,j)>,
+  compressMap = #sparlay.compress<trim(0,1)>
+}>
+
+#CSR = #sparlay.encoding<{
+  crdMap = #sparlay.crd<(i,j)->(i,j)>,
+  compressMap = #sparlay.compress<fuse(0), trim(1,1)>
+}>
+
+#BDIA = #sparlay.encoding<{
+  crdMap = #sparlay.crd<(i,j)->(i floordiv 50, j minus i, i mod 50)>,
+  compressMap = #sparlay.compress<fuse(0), trim(1,1)>
+}>
+
+#trait1 = {
+indexing_maps = [
+    affine_map<(i,j) -> (i, j)>,  // A
+    affine_map<(i,j) -> (j)>,  // B
+    affine_map<(i,j) -> (i)>   // X (out)
+  ],
+  iterator_types = ["parallel", "reduction"],
+  doc = "X(i) =+ A(i,j) * B(j)"
+}
+
+module {
+  func.func private @rtclock() -> f64
+  func.func private @getTensorFilename(index) -> (!Filename)
+  func.func @kernel_csr_spmv(%arg0: tensor<?x?xf32, #CSR>, %arg1: tensor<?xf32>, %argx: tensor<?xf32>) -> tensor<?xf32> {
+    %0 = linalg.generic #trait1
+    ins(%arg0, %arg1 : tensor<?x?xf32, #CSR>, tensor<?xf32>)
+    outs(%argx: tensor<?xf32>) {
+    ^bb0(%a: f32, %b: f32, %x: f32):
+      %2 = arith.mulf %a, %b : f32
+      %3 = arith.addf %x, %2 : f32
+      linalg.yield %3 : f32
+    } -> tensor<?xf32>
+    return %0 : tensor<?xf32>
+  }
+
+  func.func @main() {
+    %c0 = arith.constant 0: index
+    %c1 = arith.constant 1 : index
+    %f0 = arith.constant 0.0: f32
+    %f05 = arith.constant 0.5: f32
+    %i1 = arith.constant 1: i32
+    %blockSize = arith.constant 100: i32
+    %thres_1 = arith.constant 0.3: f32
+
+    %fileName = call @getTensorFilename(%c0) : (index) -> (!Filename)
+    %A_1 = sparlay.fromFile (%fileName): !llvm.ptr<i8> to tensor<?x?xf32, #COO>
+    %dim1 = tensor.dim %A_1, %c1 : tensor<?x?xf32, #COO>
+    %dim0 = tensor.dim %A_1, %c0 : tensor<?x?xf32, #COO>
+
+    %t_start0 = call @rtclock() : () -> f64
+    %S_1 = sparlay.decompose_BDIA %A_1, %blockSize, %thres_1 : tensor<?x?xf32, #COO>, i32, f32 to 
+          !sparlay.struct< tensor<?x?xf32,#COO>, tensor<?x?xf32,#BDIA> >
+    %t_end0 = call @rtclock() : () -> f64
+    %t_0 = arith.subf %t_end0, %t_start0: f64
+    vector.print %t_0 : f64
+    
+    %B_0 = sparlay.struct_access %S_1[0]: 
+              !sparlay.struct< tensor<?x?xf32,#COO>, tensor<?x?xf32,#BDIA> >
+          to  tensor<?x?xf32, #COO>
+    %B_1 = sparlay.struct_access %S_1[1]:
+              !sparlay.struct< tensor<?x?xf32,#COO>, tensor<?x?xf32,#BDIA> >
+          to  tensor<?x?xf32, #BDIA>
+
+    %D_0 = sparlay.convert(%B_0) : tensor<?x?xf32, #COO> to tensor<?x?xf32, #CSR>
+    
+    %init_256_4 = bufferization.alloc_tensor(%dim1) : tensor<?xf32>
+    %b = scf.for %i = %c0 to %dim1 step %c1 iter_args(%t = %init_256_4) -> tensor<?xf32> {
+      %k1 = arith.index_cast %i : index to i32
+      %k = arith.sitofp %k1 : i32 to f32
+      %t3 = tensor.insert %k into %t[%i] : tensor<?xf32>
+      scf.yield %t3 : tensor<?xf32>
+    }
+    
+    %o1 = bufferization.alloc_tensor(%dim0) : tensor<?xf32>
+    %o11 = scf.for %i = %c0 to %dim0 step %c1 iter_args(%t = %o1) -> tensor<?xf32> {
+      %t3 = tensor.insert %f0 into %t[%i] : tensor<?xf32>
+      scf.yield %t3 : tensor<?xf32>
+    }
+    
+    %t_start4 = call @rtclock() : () -> f64
+    // block DIA SpMV
+    %result1 = sparlay.bdia_spmv %D_0, %B_1, %b, %o1: 
+      tensor<?x?xf32, #CSR>, tensor<?x?xf32,#BDIA>, tensor<?xf32>, tensor<?xf32> to memref<?xf32>
+                          outs(%o2: tensor<?xf32>) -> tensor<?xf32>
+    %t_end4 = call @rtclock() : () -> f64
+    %t_5 = arith.subf %t_end4, %t_start4: f64
+    vector.print %t_5 : f64
+
+    %v1 = vector.transfer_read %result1[%c0], %f0: memref<?xf32>, vector<4xf32>
+    vector.print %v1 : vector<4xf32>
+    bufferization.dealloc_tensor %A_1 : tensor<?x?xf32, #COO>
+    bufferization.dealloc_tensor %B_1 : tensor<?x?xf32, #BDIA>
+    sparlay.release %S_1: !sparlay.struct< tensor<?x?xf32,#COO>, tensor<?x?xf32,#BDIA> >
+
+    return
+  }
+}
\ No newline at end of file
diff --git a/evaluation/FormatConversion/UniSparse/executables/coo_cisr b/evaluation/FormatConversion/UniSparse/executables/coo_cisr
new file mode 100755
index 0000000000000000000000000000000000000000..4cd2236eddbc9e516327abc79678437928be7dfe
GIT binary patch
literal 19208
zcmeHPeQ;dWb-z!$E6b9-l57(T40wZ0D+5|dw(R;Nj(7FtRggfjWo);=^J@25+IqFC
z?7lTJ=_E=`7%9d<(@BDdFd3#_At{s63}t9L(;7@EQ>IK{Qp$ufbu&PugeI;5*A0g4
z@7#CK>h0COmT6|%fA-G2J@@?XIp^Mc-hKDuy?ghIeS`fqh9Nlk#HR&up=Jk(sDxOz
zihxAKcF};}4dMn-3*Ij=Cq3d2q&i`|rkvI(+y_c}kEwK>UaRDoatVo&o>!P!?xZjk
zO%6|b0g5VKr+-TYLSV}2rTjuN8ICEZ+g16Qy7kC6Gi{Fi%<gj9r1EP~l=a9Q>77w}
zXOte(h{}&C`;&Y^*K;aery-<K2+7|?9}d4|C#9}R@N4uwCC`*(DSQ@sRL+kZ*zNmN
zeqMf=Qsrk#{-@BMPK|EsYELKI(y2^gs%>ifwzh3u;e0l{S=O8ElkDEx4v@GYw<=ST
zr}%1IB;%C(OA;rH!pqi66Hcu1?_Wc4RfVL-J@AJiTS@+#9`aW_<kxt}zu+PNrU(9K
z9{4RD_K$hUQ#+_sue~02{?G&eHP{K^(nAAoR3-b}5De+U;6LkuUqQY%RFD^FM-%B(
z&Mah7`N?=LZ<)D5CSw7xQ|UZ4sLrjz92glglUB|eOXY1VH!{?d&StEU_-NV^ra3l|
z&6s&Rp0iEU5v?pJ^GT$R#uJvApR{|%t;DhZEt^HsN*~Ci_RHKytV}+eBh=KyhvUgg
z@czO?CAdGAo#;=ctx9P_+2a-Qp6uj_O7i`Md`0<vRyGHxR8rZW7`KuICwumA1;27q
zqLR}mbE%BozpYE;>_j@7I3~s{Te$}n%fu%vAw_Pp?m-`5(VfiO$;8b!(@onZZ)_<x
zmPnY+%_KbG;HH_FiknAMnRq&NFWpE=Qa5rUp2~>5g9F_?=H~F`@YYIAryQdmWwDPj
z(6d}bo8x}2a7_v$QH{9H5fj}1bAQc^d`|W6jGtBG?p#Eg7mPFi+8zg|K8*V=Le9JJ
zMn^>c&bx3f8zo$D;VMfhf7yk*pTm}jOcu*PP|Z>ZMVu(%s;Uxbb>Te3Q9_3c=dpzF
z?Jiu7(*z<!B9h2_-Q!Kng;U-fh9gdlF!miGha&VVq#ZRyko=K|BoeQ8qVjj#g*UkH
zNf*Atg-^Ngl`eeRg$G@DHCpvR)dN)zR6S7j!2hQQ-fg`8m$8%Y)WuE({<U3**q6`R
zHN_vqPCi$6P8O@U^~ZpVH@=DA#`O`zh##l4h4V#(8-GMRO$io$Ao*8_r>VfgS;_xB
z@iYZkctY~e5>G?_!lRP^OX6wBUzn5p_lc*Weqmbj-zA=g^My&t|32|Fv@aZy{KLf4
zkiIZ1`QIa+hVq4o<iA2Z4dDwNlK)-eY3N=EN&a5qX~<q^lKit_A&$<0mx27#`ELWW
zFW()T{c-H%n-_*h22Tf$qkgf|D~qUh?DXzKAjPX5hTeN~V52Y?I~~|bWXEOuD!BGI
z(#W;Ti{~5HPm|$uibB3w%5SYFvgxDP?1k7fKi?C3=CUtlJRf`cBYO=D3@HP3#q&oS
z*Y_^!Q~9QM{{xam;pPLele=pu8k>E~UJ*OB`+H#KH=$bdN&Gw?_#^PfUC6tXKj|;r
zgG5!Hg}?f!SUehTTu%!<A?6l7ukp8P{4tIHrpEv5!*YANzMlR;xqS4F{llHb`L6?w
z&Hml|8=wQT&r|gK5;`}(6B%A?Z1!)A&HhX0rTNz#$<9liulxnQ8JMp}I^+qM{~jmK
z-{)u}fmZfn-UdJa3;bMcywksNzK_@@{0z?i$NbZvFisD}Z$<B3_zqay1jj+-zv#ii
z)4O-wBt-O%f!SB12L@)}kB&rVuN;V-Zo38W{=rQj(la*y;1w8p=0l&ozVmhE@4?xN
zgR?*Ho&8C)xCS|#Gh#d5DEw4rbyxJx=v~pfqvpAzi#LSwqbHN7d~QomD&4MXsCuC4
zfvN|p9;kYt>Vc{Usvf9%pz49D2fRIC;H|x}&bMnCB8|ANy-+MZ3A*Cni^YE?9`q67
zFBXgM5f56271J%C*Mfcuv;%Yyv={VFP+AYCLDQhW13C@*0O;319|3&~^i%H^i$4T?
z9Q0bOrq{qW1>@d*!kB6@)~#4pH-~h>X%D~@%7q285WUOfXN--AcHuhmi(>Ht;lZZ<
zV9RG38}6x_7JIJQb<>uOHxNwvcj9V=zWaLs8L@FSp?>_mfv_1|RChN<^{>;gCxH1i
z>^WdU!(Ib)1$n#ey#wsBhS5ir_cV;Y{a$ckt<Y-)_71Rz5EtFSrf9Gw8VsHEeYK|M
z6h)i5gR+{vNFIUg5tPRw+5TYDgEa%emaqEyf}zv?zF_MEf!<)p{k5^+_LIx@1|yl^
z_Gqvp8f@(jhPs0-uuZ1OCy&6+jH_N`t{SQysCuC4fvN|p9;kYt>Vc{Usvf9%;8*Z~
z+HA%9zcA&NL8l1?F#ZLNe^KLqr15WRJndPdP}<8x6Mh8V!}PS;WOlU!m-ex(Q#`M!
zu2DSiXQMS61x|neqhgl$dHOPp!0Vw4euwA1UA!-vKHyT=q~v)IR*M6Rs}yBY+G7@R
z5Tz!DRsCokNP+i?t#w$@stU-s{L+jxF85g_$9u*&{||~zeOMG98D;%q$`HP&N?v6z
zuw;|`H7fl-6<;d1%IE)@@V;_A-)*WL^ecLYqDK`yuIT-WenZheR`e-FpI7u%Mc-ER
zlA^Wl&4(z&T*N8K-kzSFq1FSVg^XPY?Fe^;JK8!6lI#4!=8kYjSGaSNgNw(Y;oR<5
z;ca|x74FTp?ZD*b&JBnlfj77Q#F2CFn=Lw!+F|>k!>Mh!YaMOgN=tddm}^JuyAHy8
zY8xDR_r6#Nh*tnREuLPYP`UX*pa$8bI)PtDS`9NKU>qF9FI`5!7gADA0u{{HQ3g>>
zeUUPVs^%LmgQ$cxN6MfKr06oPubC`Mm;y+bvB5W8mO!=k&6PpqSU+_abQx`izZH}&
zqt)<l0j0}WWB6(3D_zFbhJO&0E~DP?9|Wb#Xfy(kD$@@UfAD_%(q(kjQZ9d@5~*)6
zcGlNYVV-hhyXtGH;x8(U`V?b#eJ$1e9~DN;&-iqGExGY+g;8H<>}jYaKVDQA^@m2p
z!HRAyirkH6<Hq3XfG^mzc3tqv?yH-PRp`&K6N4g=mQ2tW+}W_JVGlgwW3Y2I+!Pjz
zX(1R2gkefosl85gt|s_U!{LU5RM`)4`Ne%yB*XY1xRMCUO7D=2_It9qW9|9zc+N_;
zV<UGi-#$5>Z2#@_mK|F+%S3E@Pgw0kg9H1_WGbGv5_WrOGkm*sJf1GZ?Nm0?-k;4)
z#O<DJ<~WQHP};PP*LT=?oys^zg~akwTm3{JP`^4LE(PlUSL8DEZub@JZ~In1?mPUg
zKk$97Zq?t^z7S}r^=*FPa3FB_@Zpm+ji@bcl^279cMSD96&T9W=5x_5A8^-Bc<Kn$
zCU->DgH18lc6G4)R3pmW1EQt<`iQGu05R7iFT0f>{Jz-xfcc+;4>yX>JGrHOFvRC}
z%5h(5+$_iag2&5pJRo>nEyrsGk3Z%3GQs0kIbP@NymEtx`^56nxam&v2|Qt{UoXcS
zM5rRZLNsapKk4}}`{46u<#vLC=Og8KqYxoC;>3L@jK3n@EM_X=t4i}5w>2Mj+Vi}o
z9A6_Ujh{ZuPI#Ywx%?-Dh`13a?h|XpOhvp!oT-TOY^>atPw*^E$9cA<<2*~#@$1R~
z#reeb9{BntICV#UybRY9sBf*o{T<fsyYm>W6w@01NhQzoVz&1ih!|qgKa?MZeq2U{
z`!xZa@)fG@CRqw6a2Wvke1-(^a|TzX@_W_myV6dx=(>R|EYeDLo|ef=+h-PiNlk_4
z=tXINX?y#jw6khS`+Q5`dc7`7J4@SP5Eav0BQ31+z+aO1O5q;+NudpR6WX)hZnvUd
zp$hH1%ftSyz?<odR7e&>O`3%GO%Him7gcb*_@amWLlR#p+!GASiN1AI^1~3yzY6WA
zNhQ+ci^6x5oem9u5_ogX+R}X1k;c4(?9?pn$DZ-X_ePcPq-KAI!nvPpR~ej9_^>Ab
zhKK$4RXO$hWk@?*>P7lfX$SqYX1~QlehYAF4|@L=ROO6lcFrTKCOp@VMi%p=Sj5Br
zVQGJ{A7Cwu?PHon!E%Twc-T4Rfq&Zr|5M;0Wz$Vwl=3UZ6DnVBCl4sUO>6ai-NXJb
zJ?t;Xg0WJ*QDy&#W?v+7cHS;v2WbN54*8s-X-}9qW0$e=I0cu?nq%qgXgqBu?QAY@
z#tTy-k)4=KTeg)9Z|~UFSy_lq(xuFJE*C#xS{XZcLLANEke-<=OiY}Bii<NLX_tvE
zoxGW5|Gwx@pV@a?FCD8iagx{UizzVHyHA+Chi{7x4fG(b%v`b@kOwn`xp(mP?&zR-
zdw>7_z7caI+CA83mY*M7dc4rIl5sokc@lHrb{rPOwAaM6I_cP=<BH|S3L_EsDMI~F
zC(lOZ)KO35xhHN(K5LH0Gf6sbsvQe;FIe?7p2wOdPOP#cHGPlsqpoQ!vWFL(bCFB3
zFHMR~b2Oi4A?GAzB43bq=3^dkbx*?i$mf55@K&DJq+F=w!SCAnP0jTm_nfW>=TA)7
z@ljAa=g@JE;Y6yHn-t+p*0#dY?twNtJ|@CrnL>Cxo*x(C<cSQF9ct&C6t!F`V@#yw
ztaO|dRBSSBi!e205k@pTmPN$2rtm9k7tUp6V+>p4>PZ?;!U%JYs`E%W8XQLs@rhId
z*=KFCjKWc)4&!!-FrMoPJgdO0(ZZNHSs0~rwMcOIROV=w<MGkaoOPTzdE!<{!8r`W
zfPG>T27c8*GgNe8nEN<^*GEkCnJUS;!v-+)YK`@I9mO={7DimXb}XTth+V=vIo9X*
zluS1&N!F_?X*!WzAha}ReO{L_J+BH(;{iokzXfp$J-FyyAnWt`jVZqeC0Po3{ci<E
z?;Kg5*Lh6o1q=l)Kg%&agfx1G$vm$InTALiK`+093NeNV*=GH5x)}&e&q{7Ff4%;n
zLpteqD>;5I%aq^ak_=|AOZ@kFVB{0LcX0x*Hx<=aK<oz=KaPl7Kcw`SUSL5*HS^+2
znm(^<nR0#E4D(FCqUrOzj_KFgv0DCYZ%)(abuv?apU?7o{lB5~)$~D#kdjnXmuH^o
zx0F5?)6aT}-iLH|U_HhjM}+*(`n*18`UEAq0{e}jrx2kvBt1hEc-_PQGos5g&-7X7
zV6{=w=k@+v8(CXyZw|M}v;Ip+pti^P^LqjQAD4)#7|#b;kK56gp-WX{eSUxNnwr?R
zBF!CGpXom#(XB5cO1i_LGm2%xdQ8tF!L85p^%<ql<<#|=e;X09#pUPq#2KZ}`LMip
zJH^kCK$sF|F~Rybmk=ky`b^&g%yGBqIc1RAmpkaPegHZ~@>v=f5a`o_J7}zE^3d<w
z;%H5}l@ZtVulLaZbEWV4izaDF*S|^W>;8MH%gOkZNB(SQt4ID(^-mb3enHt`JvK``
zKf8<(J*4z!R0H@Vu+6x*J@EKP-`BY9AX*CN=?ekE1}#y~pI#ejB2v#6l|=Mu3K}c^
E3kjf6aR2}S

literal 0
HcmV?d00001

diff --git a/evaluation/FormatConversion/UniSparse/executables/coo_cisr.o b/evaluation/FormatConversion/UniSparse/executables/coo_cisr.o
new file mode 100644
index 0000000000000000000000000000000000000000..dcdc17db892a8a15933a2987a0193bacd4236416
GIT binary patch
literal 6056
zcmc(jYiv|S6vyXwyGv<dyKNDQfK<WQXxME5jex)wYAHzzm3Jet-F7c@VPEWnhlvpb
znp6_0iHRmgG@AGde$bd0qVa_&pNt`b-^3UbF)<O*Ac-10|9j8b9fo`Pz!y()ch33E
zxo6JI+?ji4AAhi~r^d3Bh^1DjswGsZ_Liz1chtCQCeL4>?}#?eJ?y}V|J&}`vT>mE
z>IEdzJN}hZt{wkU)ZX!v4!YFXR6D<S{CwwS@$9_ZdFF(wRZ0g{owbt`=wl3zV>>^W
z8n@TZubO@1f3ffR-a}v1J>2z(Ga^=#b!WIG7zjsZ%nHB1YG#ww98#(#s-VPMv*AE^
zX~VLHl{1wJ2<)UGuZ^l|U0Z`v!6=0?Zwbv&oh`uI8U`D-l9xI|Nm6G>>YUlEadh+N
zE~=~41gX~ADlS$qAgWt2gM1A%?|O8VZZf<YZqUeWeyz_lg8XrP+@A@#T_nX?U{&>Y
zO`oReGc~<l(;F>x(UIrrR~v-IA+#cbfwh*_hmeej!<N;D&~cG^Qmp0mA@p3N32a4u
z2*W5c1#D$Q2;(R+6)f(-x~Qd0I#p18eOvmwQ;D=aTI$aw%V}H1R54%bDdaLeskGg*
zXd%qix%>fEH<mM^jgHy4gU$ZjUQv6>MNwCe*`vGJV<3@aZG)XFB<%vMOd^$4Z&IG_
z<ej7J?<Nb4%B?YCjvKm$<TyM=)5sMAM~IU=>RQ|`28-$>Pqay<mI`Kqh;$YMj#yeZ
z$w7tbs^$u!)HJtH)}tGgwLfCbnlh<wf^LrxpUrjhRDgAOux<~w&4Z;q*g+5WoCian
zA$l$!xv0Y0$^M2J9$>X99O(+Tc7@vx1)iy?IRZ7ZDqM%Ef9a}Khw0a{tiQukQBb$B
z=UcITxx(&PaV$}=lQEjHLNS&fOU8Dk7cIGWp;KARCr0g9f8W{-LrM1$jFqz~qJ^Rz
zv-c*_<wPl!%f@<gg-n8`CA*h`0Bp{tHacEPJy0wqQ(1n?Os;GI(}ThKmY}*EtiP$^
z3f;FpP%ga@XgMAjJoZ{(PhImTq0_;JP+;Nd!C-K3aPUw~BlVX0dLzNu)~et2<y>(O
zR5!~CgA%CjLk5>wy9Sg0q-z0N0o8aN-$V&FYwb$JHN^2;nv!9EsT2QUAO9!Wzl{Tl
z|9&6;<?L^+hYlbAm)JjU#Fw?kxKf;D{{h4Qv`_py*nimYzs1M@Px8Zf<_&-BOfqI%
z<rF74{y~N^KF59H50f9_Pq4qU9!Y<jF0c5u5C7hWKjy>nz<R}}G#$a)5gWiiS6#vT
z2m+4xmGIjENx<=b65a_&0*?Juco!fEINBHf5FiP7GhM<HfF$79gN5$_BmtjJm+&V5
zNx)m_5-#Hkeyhe`CLLn>WBegz{P$e!@L8lw{LeJ5_xFs(_5NbMAc(Jz=LLtlTp!OX
zJ{<cq1ab6yCRq-4INnc^=M;_4(fBlt-==Z-)<Arn)7PjY$i4FIMLKeZfXlNF8*>T~
zE_IkY2)M+AjX8pd{|wi3a)63-EAIl*?*Sw+`4Sgb;*7Ap+=q8FmpHOUwi>*R?Og`%
zU>oZWB5~r5r7G)O_yF@`TuOhlY`^Nm-(oIthS~nW@ZZn&hd%ss<`O5*_F01;WLut3
z$&(Hsj{M4{$+3Szgtxn<lIPjv&VXtDi`c&w36hAvaCx4E%e+Pmf8nhL?{mYd**<)}
z!R0w<_u+W2K~UiNoPa^H!tj5}#cGug?>FMS$o>g~zs|gDaGCFMgP&r5yk{XOkmorV
zB<~vhM;EJ82LFw@tXYgd_6QL_-o_4S6PL(hR)j~`?lpKD+uIG^!L~fV5+~05u;D+z
z_6r6dX8X9oCGMvNKgjmC2A^R2SuSOq*;Fc;v`5N2hY}+r1$(cG7VLB)TC(?-Saoaj
z<&n~Xyj?V5Hjx2zor<NxHT9|Nj+}d%DwIakxzXJ!n$4B$=$dt#7Zghgvh#&hwzSUP
zmriBvYi`wmJvOwXK+UL~c4?EHE#?Y1EuvwM6J?ZgC?!Tzw0Izc(rKXQzQt+?N6?|s
z)DAia3~48?q@AvO;&XI5DVpBe$<3_d^Ph<;CrYzI&V(kHlcve_Goe|hADzuQK8aSQ
z`DT@`=|=s%Dsg(7T<tusN8yI)d@F&;IuyS+EBGr%mxykVj*|t}bDS<+ewgf9?YwxA
z4%9k!YUL8)jV7F$oeX6?vHNwtn|$v7j_=362)Y=iT2GZ;`PcCWN*!-j$RFP#X8zs8
z5VM0WUEbkIIif?-rF|)}pNX!!-p}pI{vvgzZ;UFu@{jOD$v7i_<Zk9amzWuokot++
zm+vt!i0O;(FR%97J=(|KZ?>QDh)GCY=JuiMVz&PZRT9hdV^(p!!uQMfgH%ZSV&i@3
zm4BS`zsQalKm3O#_sh5*C1&P?TQ2g4tNF)(>H9SKdbQty21%qHm{@CO`*<IleJ7-@
Q@PfX;m1r0L4w(1<2MBD`w*UYD

literal 0
HcmV?d00001

diff --git a/evaluation/FormatConversion/UniSparse/temp_coo_to_cisr.mlir b/evaluation/FormatConversion/UniSparse/unisparse_coo_cisr.mlir
similarity index 75%
rename from evaluation/FormatConversion/UniSparse/temp_coo_to_cisr.mlir
rename to evaluation/FormatConversion/UniSparse/unisparse_coo_cisr.mlir
index b25ce0b..52c5aba 100644
--- a/evaluation/FormatConversion/UniSparse/temp_coo_to_cisr.mlir
+++ b/evaluation/FormatConversion/UniSparse/unisparse_coo_cisr.mlir
@@ -2,18 +2,11 @@ module {
   func.func private @delUniSparseTensorF32(!llvm.ptr<i8>)
   func.func private @sptCheckF32(!llvm.ptr<i8>, !llvm.ptr<i8>) attributes {llvm.emit_c_interface}
   func.func private @sptMoveF32(!llvm.ptr<i8>, i32, i32) -> !llvm.ptr<i8> attributes {llvm.emit_c_interface}
-  func.func private @sptSwapF32(!llvm.ptr<i8>, i32, i32) -> !llvm.ptr<i8> attributes {llvm.emit_c_interface}
-  func.func private @sptTileSplitF32(!llvm.ptr<i8>, i32, i32) -> !llvm.ptr<i8> attributes {llvm.emit_c_interface}
-  func.func private @sptSeparateF32(!llvm.ptr<i8>, i32) -> !llvm.ptr<i8> attributes {llvm.emit_c_interface}
-  func.func private @sptTrimF32(!llvm.ptr<i8>, i32) -> !llvm.ptr<i8> attributes {llvm.emit_c_interface}
-  func.func private @sptGrowF32(!llvm.ptr<i8>, i32) -> !llvm.ptr<i8> attributes {llvm.emit_c_interface}
   func.func private @sptFuseF32(!llvm.ptr<i8>, i32) -> !llvm.ptr<i8> attributes {llvm.emit_c_interface}
   func.func private @sptSumF32(!llvm.ptr<i8>, i32) -> !llvm.ptr<i8> attributes {llvm.emit_c_interface}
-  func.func private @sptEnumerateF32(!llvm.ptr<i8>, i32, i32) -> !llvm.ptr<i8> attributes {llvm.emit_c_interface}
   func.func private @sptScheduleF32(!llvm.ptr<i8>, i32, i32, i32) -> !llvm.ptr<i8> attributes {llvm.emit_c_interface}
   func.func private @sptPadF32(!llvm.ptr<i8>, i32, i32) -> !llvm.ptr<i8> attributes {llvm.emit_c_interface}
   func.func private @sptReorderF32(!llvm.ptr<i8>, i32, i32) -> !llvm.ptr<i8> attributes {llvm.emit_c_interface}
-  func.func private @sptCustTrimF32(!llvm.ptr<i8>, i32) -> !llvm.ptr<i8> attributes {llvm.emit_c_interface}
   func.func private @sptCopyF32(!llvm.ptr<i8>) -> !llvm.ptr<i8> attributes {llvm.emit_c_interface}
   func.func private @sptFromFileF32(!llvm.ptr<i8>) -> !llvm.ptr<i8> attributes {llvm.emit_c_interface}
   func.func private @rtclock() -> f64
diff --git a/evaluation/FormatConversion/coo_cisr.o b/evaluation/FormatConversion/coo_cisr.o
new file mode 100644
index 0000000000000000000000000000000000000000..af87ee95eeca1fb7c4b8f20e9d287463c7525d30
GIT binary patch
literal 496
zcmb<-^>JfjWMqH=Mg}_u1P><4z_0<qWN-kp9T-@#s)Q&M2U08yAOAymNTgm#YDEcy
zUS57ls-C-FsBUpdVsbWvk58DdOJ-tDYI2EheoARhDuZ5eNl{5+5|FOU1<_Ojnm}`y
zv6xi=6|+Q>Lk|lOAB5S^)H$H>VO$m%14^?4X>>C|QVt*j3qV(E2voy_MV$jw%m7M*
N^nuiIK=~3-8UO}68WI2i

literal 0
HcmV?d00001

diff --git a/evaluation/FormatConversion/run.sh b/evaluation/FormatConversion/run.sh
index 3379a48..db8bd93 100644
--- a/evaluation/FormatConversion/run.sh
+++ b/evaluation/FormatConversion/run.sh
@@ -19,6 +19,8 @@ mlir-opt ./UniSparse/unisparse_csb_dia_v.mlir -one-shot-bufferize="bufferize-fun
 clang++ csb_dia_v.o -L$SPLHOME/build/lib -lmlir_unisparse_runner_utils -L$LLVM_ROOT/build/lib -lmlir_runner_utils -lmlir_c_runner_utils -o csb_dia_v
 mlir-opt ./UniSparse/unisparse_coo_c2sr.mlir -one-shot-bufferize="bufferize-function-boundaries=1 allow-return-allocs unknown-type-conversion=identity-layout-map function-boundary-type-conversion=identity-layout-map" -finalizing-bufferize -convert-linalg-to-loops -convert-vector-to-scf -convert-scf-to-cf -lower-affine -convert-vector-to-llvm -convert-memref-to-llvm -convert-complex-to-standard -convert-math-to-llvm -convert-math-to-libm -convert-complex-to-libm -convert-complex-to-llvm -convert-func-to-llvm -reconcile-unrealized-casts  | mlir-translate -mlir-to-llvmir | opt -O3 -S | llc -O3 -relocation-model=pic -filetype=obj -o coo_c2sr.o
 clang++ coo_c2sr.o -L$SPLHOME/build/lib -lmlir_unisparse_runner_utils -L$LLVM_ROOT/build/lib -lmlir_runner_utils -lmlir_c_runner_utils -o coo_c2sr
+mlir-opt ./UniSparse/unisparse_coo_cisr.mlir -one-shot-bufferize="bufferize-function-boundaries=1 allow-return-allocs unknown-type-conversion=identity-layout-map function-boundary-type-conversion=identity-layout-map" -finalizing-bufferize -convert-linalg-to-loops -convert-vector-to-scf -convert-scf-to-cf -lower-affine -convert-vector-to-llvm -convert-memref-to-llvm -convert-complex-to-standard -convert-math-to-llvm -convert-math-to-libm -convert-complex-to-libm -convert-complex-to-llvm -convert-func-to-llvm -reconcile-unrealized-casts  | mlir-translate -mlir-to-llvmir | opt -O3 -S | llc -O3 -relocation-model=pic -filetype=obj -o coo_cisr.o
+clang++ coo_cisr.o -L$SPLHOME/build/lib -lmlir_unisparse_runner_utils -L$LLVM_ROOT/build/lib -lmlir_runner_utils -lmlir_c_runner_utils -o coo_cisr
 
 mlir-opt ./sparse_tensor_dialect/sparse_tensor_csr_to_csc.mlir -sparse-compiler | mlir-translate -mlir-to-llvmir | opt -O3 -S | llc -O3 -relocation-model=pic -filetype=obj -o sparse_tensor_csr_csc.o
 clang++ sparse_tensor_csr_csc.o -L$LLVM_ROOT/build/lib -lmlir_runner_utils -lmlir_c_runner_utils -o sparse_tensor_csr_csc
@@ -56,4 +58,7 @@ do
 
     echo COO_C2SR UniSparse 
     ./coo_c2sr
+
+    echo COO_CISR UniSparse 
+    ./coo_cisr
 done
\ No newline at end of file