Hello Computer Vision

CIFAR100-C, CIFAR100 비교 본문

딥러닝/파이토치

CIFAR100-C, CIFAR100 비교

지웅쓰 2024. 2. 29. 23:33

1. 데이터의 개수는 같지만 각각의 해당되는 데이터 라벨은 다르다. 

file_path = '/content/CIFAR-100-C/labels.npy'
data_array = np.load(file_path)
print("데이터 형태:", data_array.shape)
print("데이터 내용:")

cor = np.array(cifar_dataset.targets) == data_array
print(np.sum(cor))
데이터 형태: (50000,)
데이터 내용:
475

2. 제일 놀라운 사실. CIFAR100 C 에는 50,000개의 단순한 노이즈 데이터들이 있는 것이 아닌, 10,000개 묶음으로 severity 가 높아진다. 한마디로 처음 10개의 이미지와, 10000~10010번째 이미지, 20000~20010번째... 40000~40010번째 이미지가 같다는 말이다. 만약 50000개를 그대로 test data에 넣는다면 정확한 지표를 생산할 수 없다.

print(data_array[:10])
print(data_array[10000:10010])
print(data_array[20000:20010])
print(data_array[30000:30010])
print(data_array[40000:40010])
[49 33 72 51 71 92 15 14 23  0]
[49 33 72 51 71 92 15 14 23  0]
[49 33 72 51 71 92 15 14 23  0]
[49 33 72 51 71 92 15 14 23  0]
[49 33 72 51 71 92 15 14 23  0]

3. CIFAR100-C 데이터셋과 CIFAR100 테스트 데이터 셋의 이미지는 똑같다.

print(cifar_dataset.targets[:10])
print(data_array[:10])
print(data_array[10000:10010])
print(data_array[20000:20010])
print(data_array[30000:30010])
print(data_array[40000:40010])
[49, 33, 72, 51, 71, 92, 15, 14, 23, 0]
[49 33 72 51 71 92 15 14 23  0]
[49 33 72 51 71 92 15 14 23  0]
[49 33 72 51 71 92 15 14 23  0]
[49 33 72 51 71 92 15 14 23  0]
[49 33 72 51 71 92 15 14 23  0]