New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

Sign up for GitHub

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Jump to bottom

s3 based case store #11

Merged

etiennehomer merged 155 commits into main from case_s3

Nov 12, 2024

Contributor

jonenst commented Jun 28, 2023

Please check if the PR fulfills these requirements

The commit message follows our guidelines
Tests for the changes have been added (for bug fixes / features)
Docs have been added / updated (for bug fixes / features)

Does this PR already have an issue describing the problem?

NO

What kind of change does this PR introduce?

Feature

What is the current behavior?

cases stored in folder

What is the new behavior (if this is a feature change)?
cases stored in external s3 api

Does this PR introduce a breaking change or deprecate an API?

The Breaking Change or Deprecated label has been added
The migration guide has been updated in the github wiki (What changes might users need to make in their application due to this PR?)
NO

Other information:

not finished, need all API to be efficient. For now everything is downloaded everytime

jonenst force-pushed the case_s3 branch from 0883cb5 to a966d53 Compare

June 28, 2023 16:03


          s3 based case store

4f5d98a

Signed-off-by: HARPER Jon <[email protected]>

jonenst force-pushed the case_s3 branch from a966d53 to 4f5d98a Compare

July 12, 2023 15:22

sonarqubecloud bot commented Jul 12, 2023

SonarCloud Quality Gate failed.

0 Bugs
0 Vulnerabilities
1 Security Hotspot
26 Code Smells

84.9% Coverage
0.0% Duplication

Catch issues before they fail your Quality Gate with our IDE extension SonarLint


          Merge branch 'main' into case_s3

db41032

ghazwarhili changed the title ~~[WIP] s3 based case store~~ s3 based case store

ghazwarhili requested a review from FranckLecuyer

October 27, 2023 08:31

FranckLecuyer requested changes

View reviewed changes

src/main/java/com/powsybl/caseserver/CaseController.java Outdated Show resolved Hide resolved

src/main/java/com/powsybl/caseserver/CaseController.java Outdated Show resolved Hide resolved

src/main/java/com/powsybl/caseserver/ObjectStorageService.java Outdated Show resolved Hide resolved

src/main/java/com/powsybl/caseserver/ObjectStorageService.java Outdated Show resolved Hide resolved

src/main/java/com/powsybl/caseserver/datasource/util/S3CaseDataSourceService.java Outdated Show resolved Hide resolved

src/test/java/com/powsybl/caseserver/datasource/util/AbstractCaseDataSourceControllerTest.java Outdated Show resolved Hide resolved

src/test/java/com/powsybl/caseserver/datasource/util/AbstractCaseDataSourceControllerTest.java Outdated Show resolved Hide resolved

src/test/java/com/powsybl/caseserver/S3CaseControllerTest.java Outdated Show resolved Hide resolved

src/test/java/com/powsybl/caseserver/FsCaseControllerTest.java Outdated Show resolved Hide resolved

src/test/java/com/powsybl/caseserver/CaseServiceTest.java Outdated Show resolved Hide resolved

ghazwarhili requested a review from FranckLecuyer

October 31, 2023 08:01

FranckLecuyer requested changes

View reviewed changes

Contributor

FranckLecuyer left a comment

Tests: OK
Code review:

remove some code smells
fix security hotspot
fix DCO

REHILI Ghazwa (Externe) added 6 commits

November 5, 2023 17:03


          implement and handle the two mode of object and file storage system

7c7157f

Signed-off-by: Rehili Ghazwa <[email protected]>


          clean code

e94e02c

Signed-off-by: Rehili Ghazwa <[email protected]>


          fix code review remarqs

ebba256

Signed-off-by: Rehili Ghazwa <[email protected]>


          fix unused import

833c839

Signed-off-by: Rehili Ghazwa <[email protected]>


          fix code review remarqs

4dc872d

Signed-off-by: Rehili Ghazwa <[email protected]>


          fix some code smell issues

80566f7

Signed-off-by: Rehili Ghazwa <[email protected]>

ghazwarhili force-pushed the case_s3 branch from c9fccdf to 80566f7 Compare

November 5, 2023 16:05

ghazwarhili added 3 commits

November 5, 2023 17:25


          fix sonar smells

ffbb128

Signed-off-by: Rehili Ghazwa <[email protected]>


          fix using publicly writable directories is security-sensitive java:S5443

a657b8a

Signed-off-by: Rehili Ghazwa <[email protected]>


          Handle Catch Exception instead of Throwable smells

ee1d7be

Signed-off-by: Rehili Ghazwa <[email protected]>

ghazwarhili requested a review from FranckLecuyer

November 6, 2023 07:51

FranckLecuyer approved these changes

View reviewed changes

ghazwarhili added 2 commits

November 6, 2023 17:04


          refacto s3 test without bean mock

bdb2a2e

Signed-off-by: Rehili Ghazwa <[email protected]>


          unify testcontainer config

1d96977

Signed-off-by: Rehili Ghazwa <[email protected]>

jonenst commented

View reviewed changes

src/main/java/com/powsybl/caseserver/ObjectStorageService.java Outdated Show resolved Hide resolved

jonenst commented

View reviewed changes

src/main/java/com/powsybl/caseserver/ObjectStorageService.java Outdated Show resolved Hide resolved

jonenst commented

View reviewed changes

src/main/java/com/powsybl/caseserver/ObjectStorageService.java Outdated Show resolved Hide resolved

jonenst commented

View reviewed changes

src/test/java/com/powsybl/caseserver/AbstractContainerConfig.java Outdated Show resolved Hide resolved

jonenst commented

View reviewed changes

src/main/resources/config/application-local.yaml Outdated

+                aws:
+                  s3:
+                    # using host ip address for s3 endpoint because spring cloud aws 2.x doesn't allow
+                    # spring.cloud.aws.s3.path-style-access-enabled (only spring cloud aws 3.x), to be revisisted ?

Contributor Author

jonenst Nov 7, 2023

can this be revisted now ?

Contributor

ghazwarhili Nov 17, 2023

done


          fix code review remarqs

e5cea59

etiennehomer added 7 commits

November 4, 2024 15:41


          Clean

7706ee5

Signed-off-by: Etienne Homer <[email protected]>


          Merge branch 'case_s3_compress_archived_files' into case_s3

0d12be6


          Fix .gz regex

5acd02f

Signed-off-by: Etienne Homer <[email protected]>


          Fix sonar

9cbca2e

Signed-off-by: Etienne Homer <[email protected]>


          Remove last compression extension

c3bdd4f

Signed-off-by: Etienne Homer <[email protected]>


          Space after if

355c498

Signed-off-by: Etienne Homer <[email protected]>


          Clean removeExtension()

460af0e

Signed-off-by: Etienne Homer <[email protected]>

etiennehomer approved these changes

View reviewed changes

Fix

904215f

Signed-off-by: Etienne Homer <[email protected]>

etiennehomer approved these changes

View reviewed changes

Collaborator

etiennehomer left a comment

Code ok.
Tests ok for filesystem and S3

etiennehomer added 2 commits

November 6, 2024 14:10


          Remove Throwable

ccfc5cc

Signed-off-by: Etienne Homer <[email protected]>


          Clean

8d25d02

Signed-off-by: Etienne Homer <[email protected]>

ghazwarhili reviewed

View reviewed changes

src/main/java/com/powsybl/caseserver/CaseException.java Outdated

+                      return new CaseException(Type.TEMP_FILE_PROCESS, "Error processing temporary case file: " + uuid, e);
+                  }
+                  public static CaseException importZipContent(UUID uuid, Exception e) {

Contributor

ghazwarhili Nov 6, 2024

importZipContent and processTempFile unused to be removed

Collaborator

etiennehomer Nov 7, 2024

done

src/main/java/com/powsybl/caseserver/service/S3CaseService.java Outdated

+                  }
+                  public Set<String> listName(UUID caseUuid, String regex) {
+                      List<String> fileNames;

Contributor

ghazwarhili Nov 7, 2024

redundancy calls of getOriginalFilename
String originalFilename = getOriginalFilename(caseUuid);

Collaborator

etiennehomer Nov 7, 2024

done

src/main/java/com/powsybl/caseserver/service/S3CaseService.java Outdated

+                      List<String> fileNames;
+                      if (isCompressedCaseFile(getOriginalFilename(caseUuid))) {
+                          // For a compressed file basename.xml.gz, listName() should return ['basename.xml']. That's why we remove the compression extension to the filename.
+                          fileNames = List.of(removeExtension(getOriginalFilename(caseUuid), "." + getCompressionFormat(caseUuid)));

Contributor

ghazwarhili Nov 7, 2024

to eliminate the need for if-else then if ...

return Set.of(removeExtension(originalFilename, "." + getCompressionFormat(caseUuid)))
                    .stream()
                    .filter(name -> name.matches(regex))
                    .collect(Collectors.toSet());

Collaborator

etiennehomer Nov 7, 2024

Yes but the actual form of the code allow to filter with the regex at only one place and the logic is easier to comprehend that way

src/main/java/com/powsybl/caseserver/service/S3CaseService.java Outdated

+                          fileNames = List.of(removeExtension(getOriginalFilename(caseUuid), "." + getCompressionFormat(caseUuid)));
+                      } else {
+                          List<S3Object> s3Objects = getCaseFileSummaries(caseUuid);
+                          fileNames = s3Objects.stream().map(obj -> Paths.get(obj.key()).toString().replace(CASES_PREFIX + caseUuid.toString() + DELIMITER, "")).toList();

Contributor

ghazwarhili Nov 7, 2024

use getCaseName(caseUuid) to replace Paths.get(obj.key()).toString().replace(CASES_PREFIX + caseUuid.toString() + DELIMITER, "")

Collaborator

etiennehomer Nov 7, 2024

I don't get what you want to do. Here, we need to clean the key from the bucket name and the caseUuid. We can't do much with getCaseName(caseUuid)

src/main/java/com/powsybl/caseserver/service/S3CaseService.java Outdated

+                              // the original archive name has to be filtered.
+                              fileNames = fileNames.stream().filter(name -> !name.equals(getOriginalFilename(caseUuid))).toList();
+                              // each subfile hase been gzipped -> we have to remove the gz extension (only one, the one we added).
+                              fileNames = fileNames.stream().map(name -> removeExtension(name, GZIP_EXTENSION)).toList();

Contributor

ghazwarhili Nov 7, 2024

fileNames = fileNames.stream()
                    .filter(name -> !name.equals(originalFilename))
                    .map(name -> removeExtension(name, GZIP_EXTENSION))
                    .collect(Collectors.toList());

Collaborator

etiennehomer Nov 7, 2024

done

src/main/java/com/powsybl/caseserver/service/S3CaseService.java Outdated

+                      // To optimize copy, files to copy are not downloaded on the case-server. They are directly copied on the S3 server.
+                      CopyObjectRequest copyObjectRequest = CopyObjectRequest.builder()
+                              .sourceBucket(bucketName)
+                              .sourceKey(CASES_PREFIX + sourcecaseUuid + "/" + fileName)

Contributor

ghazwarhili Nov 7, 2024

DELIMITER

Collaborator

etiennehomer Nov 7, 2024

done

src/main/java/com/powsybl/caseserver/service/S3CaseService.java Outdated

+                              .sourceBucket(bucketName)
+                              .sourceKey(CASES_PREFIX + sourcecaseUuid + "/" + fileName)
+                              .destinationBucket(bucketName)
+                              .destinationKey(CASES_PREFIX + caseUuid + "/" + fileName)

Contributor

ghazwarhili Nov 7, 2024

DELIMITER

Collaborator

etiennehomer Nov 7, 2024

done

src/main/java/com/powsybl/caseserver/service/S3CaseService.java Outdated

+                      try {
+                          s3Client.copyObject(copyObjectRequest);
+                      } catch (S3Exception e) {
+                          throw new ResponseStatusException(HttpStatus.NOT_FOUND, "Source file " + caseUuid + "/" + fileName + NOT_FOUND);

Contributor

ghazwarhili Nov 7, 2024

DELIMITER

Collaborator

etiennehomer Nov 7, 2024

done

src/main/java/com/powsybl/caseserver/service/S3CaseService.java Outdated

+                      if (!objectsToDelete.isEmpty()) {
+                          DeleteObjectsRequest deleteObjectsRequest = DeleteObjectsRequest.builder()
+                              .bucket(bucketName)
+                              .delete(Delete.builder().objects(objectsToDelete).build())

Contributor

ghazwarhili Nov 7, 2024

.delete(delete -> delete.objects(objectsToDelete))

Collaborator

etiennehomer Nov 7, 2024

done

src/main/java/com/powsybl/caseserver/service/S3CaseService.java Outdated

+                      if (!objectsToDelete.isEmpty()) {
+                          DeleteObjectsRequest deleteObjectsRequest = DeleteObjectsRequest.builder()
+                                  .bucket(bucketName)
+                                  .delete(Delete.builder().objects(objectsToDelete).build())

Contributor

ghazwarhili Nov 7, 2024

.delete(delete -> delete.objects(objectsToDelete))

Collaborator

etiennehomer Nov 7, 2024

done

ghazwarhili reviewed

View reviewed changes

src/main/java/com/powsybl/caseserver/service/S3CaseService.java

+                      int firstSlash = key.indexOf(DELIMITER);
+                      int secondSlash = key.indexOf(DELIMITER, firstSlash + 1);
+                      return key.substring(secondSlash + 1);
+                  }

Contributor

ghazwarhili Nov 7, 2024

Both methods parseUuidFromKey and parseFilenameFromKey are finding the indices of firstSlash and secondSlash, which are the same calculations in both. We can calculate these indices only once and reuse them

Contributor Author

jonenst Nov 7, 2024

not sure if it's worth it. If we wanted to do this, we should create a pojo with all the parsed info and then someone can read the differents parts..

Collaborator

etiennehomer Nov 7, 2024

Yes too complicated. let's keep it simple

jonenst commented

View reviewed changes

src/main/java/com/powsybl/caseserver/service/S3CaseService.java Outdated

+                      return getCaseMetaDataEntity(caseUuid).getOriginalFilename();
+                  }
+                  // key format is "gsi-cases/UUID/filename"

Contributor Author

jonenst Nov 7, 2024

Suggested change

      
                // key format is "gsi-cases/UUID/filename"
          
                // key format is "gsi-cases/UUID/path/to/file"

Collaborator

etiennehomer Nov 7, 2024

done

jonenst commented

View reviewed changes

src/main/java/com/powsybl/caseserver/service/S3CaseService.java Outdated

+                  private List<S3Object> getCaseFileSummaries(UUID caseUuid) {
+                      List<S3Object> files = getCasesSummaries(uuidToKeyPrefix(caseUuid));
+                      if (files.size() > 1) {

Contributor Author

jonenst Nov 7, 2024

to remove

Collaborator

etiennehomer Nov 7, 2024

removed

jonenst commented

View reviewed changes

src/main/java/com/powsybl/caseserver/service/S3CaseService.java Outdated

+                      return files;
+                  }
+                  private List<CaseInfos> infosFromDownloadCaseFileSummaries(List<S3Object> objectSummaries) {

Contributor Author

jonenst Nov 7, 2024

rename remove "Download" we should use it only for fileaccess to better understand the code ?

Collaborator

etiennehomer Nov 7, 2024

method removed

etiennehomer added 9 commits

November 7, 2024 14:17


          Add fileName as requestParam to exportCase endpoint

80e331a

Signed-off-by: Etienne Homer <[email protected]>


          Remove 'summaries' + remove warning on multiple files

Signed-off-by: Etienne Homer <[email protected]>


          clean comment

e69fa42

Signed-off-by: Etienne Homer <[email protected]>


          use DELIMITER

23a212b

Signed-off-by: Etienne Homer <[email protected]>


          listName(): filter and map fileNames in one instruction + call getOri…

97c4f56

…ginalFilename() once

Signed-off-by: Etienne Homer <[email protected]>


          fileNames to filenames

16a7625

Signed-off-by: Etienne Homer <[email protected]>


          Clean

5c8f7f0

Signed-off-by: Etienne Homer <[email protected]>


          remove Delete.builder()

6cf316c

Signed-off-by: Etienne Homer <[email protected]>


          Rename storage to FS

9d69962

Signed-off-by: Etienne Homer <[email protected]>

sonarqubecloud bot commented Nov 7, 2024

Quality Gate passed

Issues
2 New issues
0 Accepted issues

Measures
0 Security Hotspots
80.8% Coverage on New Code
0.0% Duplication on New Code

See analysis details on SonarCloud

ghazwarhili approved these changes

View reviewed changes

etiennehomer merged commit ed4c357 into main

4 checks passed

etiennehomer deleted the case_s3 branch

November 12, 2024 09:24

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet