딥러닝은 레이블이 지정되지 않은 데이터를 처리하고 패턴을 인식할 수 있는 강력한 유형의 머신 러닝입니다. 딥러닝은 여러 유형의 AI의 기반이 됩니다.
이 글을 읽은 후에 다음을 할 수 있습니다:
글 링크 복사
딥러닝은 복잡한 패턴을 인식하고 인간과 유사한 방식으로 연관성을 만들 수 있는 머신 러닝의 한 유형입니다. 딥러닝의 기능은 사진 속 사물을 식별하거나 음성을 인식하는 것부터 자동차를 운전하거나 일러스트를 그리는 것까지 다양합니다. 기본적으로 딥러닝 모델은 데이터를 처리하는 복잡하고 정교한 접근 방식 덕분에 지능을 발휘할 수 있는 컴퓨터 프로그램입니다.
딥러닝은 인공 지능(AI)의 한 종류로, 얼마나 많은 AI 서비스와 모델이 작동할지를 결정하는 데 있어 핵심입니다. ChatGPT, Bard, Bing Chat 등의 대규모 언어 모델(LLM)과 Midjourney, DALL-E 등의 이미지 생성기는 딥러닝을 통해 언어와 문맥을 학습하고 사실적인 응답을 생성합니다. 예측 AI 모델은 딥러닝을 사용하여 방대한 과거 데이터 모음에서 결론을 도출합니다.
일반적으로 컴퓨터 프로그램을 사용하려면 정확한 출력을 얻기 위해 정확한 입력이 필요합니다. 반면 딥러닝은 임의적이거나 부정확한 데이터를 가져와서 관련성 있는 결과를 도출할 수 있습니다. 예를 들어, 기존의 컴퓨터 프로그램은 두 개의 디지털 인물 사진이 정확히 동일한지 여부를 판별할 수 있습니다. 딥러닝 모델은 인물 사진 자체는 서로 다르더라도 인물 사진의 피사체가 유사한지를 인식할 수 있습니다.
딥러닝은 대규모 데이터 세트와 많은 연산 능력에 의존하며, 이 두 가지의 가용성이 높아짐에 따라 딥러닝 모델은 더욱 정교해졌습니다. 오늘날 빅데이터 수집과 GPU 기반 클라우드 컴퓨팅 서비스를 통해 개발자와 일반 사용자가 딥러닝에 그 어느 때보다 더 쉽게 접근할 수 있게 되었습니다.
머신 러닝은 명시적인 지시 없이도 학습할 수 있는 컴퓨터 프로그램의 일종입니다. 딥러닝은 제트기가 특수한 종류의 비행기인 것처럼 머신 러닝의 특수한 종류입니다. 두 가지 모두 컴퓨터 프로그램이 데이터 집합을 통해 스스로 학습하도록 합니다. 하지만 제트기가 프로펠러 비행기나 글라이더보다 더 강력한 성능을 발휘하는 것처럼 딥러닝은 더 많은 일을 할 수 있습니다.
딥러닝은 레이블이 지정되지 않은 데이터에서도 학습할 수 있지만, 보다 기본적인 머신 러닝 모델은 "학습"을 올바르게 수행하려면 공급되는 데이터에 대한 더 많은 컨텍스트가 필요할 수 있습니다. 마지막으로, 딥러닝 모델은 신경망을 사용하여 구축됩니다. 머신 러닝 모델은 신경망을 기반으로 구축될 수 있지만, 항상 그런 것은 아닙니다.
딥러닝은 이미 전 세계에서 수많은 앱에 적용되어 있으며, 새로운 용도가 계속 발견되고 있습니다. 현재 사용 사례는 다음과 같습니다.
(Low-Rank Adaptation과 같은 기술은 개발자가 새로운 용도에 맞춰 딥러닝 모델을 빠르게 조정하는 데 도움이 될 수 있습니다.)
머신 러닝 분야에서 비지도 학습은 데이터 세트에 포함된 내용에 대한 컨텍스트 없이 대규모 데이터 세트에서 패턴과 연관성을 식별하는 방법입니다. 이와는 대조적으로 지도 학습에는 모델에 예제 입력과 출력이 제공됩니다. 딥러닝은 모델 학습에 지도 학습을 이용할 수 있지만, 비지도 학습이 가능하다는 점에서 다른 유형의 머신 러닝과 차별화됩니다.
머신 러닝 모델에 뉴스 기사의 예와 함께 각 기사의 주제가 무엇인지 표시된다고 가정해 보겠습니다. 충분한 학습이 끝나면 이 모델은 특정 주제에 대한 글을 "작성" 할 수 있습니다. 이것이 바로 지도 학습입니다.
이제 딥러닝 모델에 각 기사의 내용에 대한 안내 없이 일련의 예시 뉴스 기사가 제공된다고 가정해 보겠습니다. 이러한 모델이 충분히 강력하다면 입력된 주제만으로 특정 주제에 대한 기사를 작성할 수 있습니다. 이것이 비지도 학습입니다.
레이블이 지정되지 않은 데이터는 분류, 태그, 레이블이 없는 데이터입니다. 레이블이 지정되지 않은 데이터 세트에는 임의의 데이터가 포함될 수 있으며 임의의 사진, 동영상 편집, 긴 파일 이름 목록, 로그 데이터, 이들 모두의 조합 등 모든 형태를 취할 수 있습니다. 앞의 예에서 컨텍스트 없이 제공되는 뉴스 기사는 레이블이 지정되지 않은 데이터의 예입니다.
딥러닝 모델은 문맥을 파악하고 레이블이 없는 데이터를 "이해"할 수 있습니다. 그리고 일반적으로 더 많은 데이터가 입력될수록 모델은 더욱 정교해집니다.
레이블이 지정되지 않은 데이터는 비정형 데이터인 경우가 많습니다. 비정형 데이터는 특정 형식을 따르지 않으므로 모든 유형의 디지털 정보가 포함될 수 있습니다. 개체 스토리지는 이러한 종류의 비정형 데이터를 저장하는 데 자주 사용됩니다. 이러한 데이터 수집은 무한정 늘어날 수 있으며, 개체 스토리지는 확장성이 뛰어나고 상당히 비용 효율적인 저장 방식입니다.
딥러닝 모델은 레이블이 지정되지 않은 비정형 데이터라도 학습할 수 있는 대규모 데이터 컬렉션이 제공되면 더욱 효과적으로 성장합니다. 따라서 개체 스토리지는 딥러닝 모델에 있어 중요한 리소스입니다.
신경망은 인간의 뇌가 작동하는 방식을 기반으로 하는 일종의 머신 러닝 아키텍처입니다. 신경망은 노드의 집합으로, 각 노드는 자체 처리 장치입니다. 통계적으로 유의미한 데이터는 한 노드에서 다음 노드로 전달됩니다.
이러한 노드는 입력층, 은닉층, 출력층 등 최소 세 개의 층에 분산되어 있습니다. 일반적으로 각 층에는 여러 개의 노드가 있습니다. 은닉층이 여러 개 있을 수 있으며, 딥러닝 모델에는 많은 층이 있는 경향이 있습니다.
신경망을 문제를 해결하기 위해 협력하는 팀이라고 생각해 보세요. 팀원 각자가 문제의 한 가지 측면을 담당하고, 자신의 역할이 끝나면 다음 팀원에게 업무를 넘깁니다. 최종적으로, 팀이 함께 완전한 솔루션에 도달합니다.
신경망은 수십 년 동안 존재해 왔지만, 오늘날의 딥러닝은 과거의 신경망보다 더 많은 층을 사용합니다. 오늘날의 딥러닝 모델은 이전보다 훨씬 더 많은 컴퓨팅 성능과 데이터에 액세스할 수 있어 개발자가 AI 기술 발전을 가속화할 수 있습니다.
Cloudflare에서는 개발자가 최소한의 대기 시간으로 어디서나 액세스할 수 있는 AI 앱을 쉽게 구축할 수 있도록 지원합니다. Cloudflare Workers AI는 첨단 머신 러닝 모델을 실행하도록 Cloudflare의 전역 네트워크에서 서버리스 GPU에 대한 액세스를 제공합니다. 또한 Cloudflare R2는 송신 수수료가 없는 개체 스토리지로, 딥러닝 모델을 학습시키는 데 사용할 수 있는 대규모 데이터 세트를 보다 비용 효율적으로 저장할 수 있습니다.
Cloudflare for AI에 대해 모두 알아보세요.