pkl2pianoroll.py

import hydra
from hydra.utils import to_absolute_path
import h5py
import numpy as np
import pickle
from End2End.target_processors import TargetProcessor
from pathlib import Path
import tqdm
from hydra.utils import to_absolute_path
import os
from End2End.MIDI_program_map import (
                                      MIDI_Class_NUM,
                                      MIDIClassName2class_idx,
                                      class_idx2MIDIClass,
                                      )
import torch

# constants
frames_per_second=100
SAMPLE_RATE=16000


@hydra.main(config_path="End2End/config/", config_name="pkl2pianoroll")
def main(cfg):
    
    audio_h5_path = to_absolute_path(cfg.audio_h5_path)
    pkl_path = to_absolute_path(cfg.pkl_path)
    
    # output name based on the original audio_h5_path name
    roll_name = os.path.basename(audio_h5_path).split('_')[0] + '_roll.h5'
    roll_h5_path = os.path.join(to_absolute_path(cfg.roll_output_path), roll_name)
    
    
    target_processor = TargetProcessor(frames_per_second=frames_per_second,
                                       begin_note=21,
                                       classes_num=88)
    
    with h5py.File(audio_h5_path, 'r') as h5:
        pkl_list = list(Path(pkl_path).glob('*.pkl'))
        with h5py.File(roll_h5_path, "w") as hf:
            num_pkl = len(pkl_list)
            num_audio = len(h5.keys())
            if num_pkl!=num_audio:
                val = input(f"num_pkl={num_pkl}, while num_audio={num_audio}\n"
                            f"Do you want to continue? [y/n]")
                if val.lower()=='y':
                    pass
                elif val.lower()=='n':
                    raise ValueError(f"please check if it is normal to have missing pkl files")
                else:
                    raise ValueError(f"Unkonwn input: {val}, please try again")
                    
            for pkl_path in tqdm.tqdm(sorted(pkl_list)):
                piece_name = pkl_path.name[:-4]
                note_event = pickle.load(open(pkl_path, 'rb'))
                valid_length = len(h5[piece_name][()])
                segment_seconds = valid_length/SAMPLE_RATE

                flat_frame_roll = event2roll(0,
                                             segment_seconds,
                                             note_event,
                                             target_processor)
                hf.create_dataset(piece_name, data=flat_frame_roll) 
    
    
def event2roll(start_time, segment_seconds, note_events, target_processor):
    keys = list(note_events.keys())
    key = keys[0]
    target_dict_per_plugin = target_processor.pkl2roll(start_time=0, 
                                                                    segment_seconds=segment_seconds,
                                                                    note_events=note_events[key],
                                                                   )
    frame_roll = target_dict_per_plugin['frame_roll']
    placeholder = np.zeros_like(frame_roll).astype('bool')
    placeholder = np.expand_dims(placeholder,0)
    placeholder = placeholder.repeat(39,0)
    
    placeholder[MIDIClassName2class_idx[key]] = frame_roll
    for key in keys[1:]:
        target_dict_per_plugin = target_processor.pkl2roll(start_time=0, 
                                                                        segment_seconds=segment_seconds,
                                                                        note_events=note_events[key],
                                                                       )    
        placeholder[MIDIClassName2class_idx[key]] = target_dict_per_plugin['frame_roll']
        
    return placeholder


if __name__ == '__main__':
    main()