복잡한 포스트
Description
몸에 잘 맞는 맞춤 정장을 제작하려면 정확한 신체 치수가 필수이듯, 개인화된 AI 구현에는 데이터가 중요한 역할을 한다.
삼성전자가 방대한 데이터를 유의미한 사용자 경험으로 변환하기 위해 ‘데이터 인텔리전스(Data Intelligence)’ 연구에 집중하고 있는 이유다.
개인화 AI 시대를 열어가는 삼성전자의 첨단 데이터 연구와 혁신적인 연결 경험을 살펴보자.
00:13 데이터 인텔리전스
01:26 지식 그래프란?
02:12 지식 그래프의 유용성
02:59 지식 그래프의 구조와 강점
04:36 기술 전망과 포부
#삼성전자 #삼성리서치 #AI #기술 #데이터인텔리전스 #지식그래프
Notes
YT=
추출한 내용 원본
0:09 → Interview knowledge graph
data intelligence X Ontology
0:12 → Q. ‘데이터 인텔리전스’란?
0:14 → 사용자한테 직접적으로
0:15 → ‘뭘 좋아하세요?’라고 물어볼 수는 없으니까
0:17 → 저희가 사용자가 남긴 흔적들 데이터들을 기반으로
0:21 → 사용자를 파악하는 기술이 필요합니다
0:23 → 사용자를 그렇게 잘 파악하고 나서
0:25 → 이 사용자가 무엇을 어떤 때
0:27 → 원하는지를 정확하게 집어서
0:30 → 적합한 시점에 그것을 제공하는 기술을
0:32 → 저희가 개발을 하고 있습니다
0:33 → 데이터 인텔리전스란
0:35 → 사용 데이터를 기반으로 사용자를 파악하고
0:38 → 맥락에 맞는 서비스를 제공하기 위한 기술 전반을 포함합니다
0:43 → 안녕하세요
0:45 → 저는 삼성 리서치에서 데이터 인텔리전스 팀을 맡고 있는 이윤수라고 합니다
0:50 → Q. 정보를 처리하고 활용하는 데이터 기술에도 다양한 종류가 있다는 것인가요?
0:52 → 저희가 집중을 하고 있는 기술은
0:54 → 데이터를 연결하는 기술입니다
0:57 → 모바일 폰을 보면
0:58 → 다양한 서비스 앱들이 존재합니다
1:00 → 그 앱들 안에서만 데이터가 존재하지
1:03 → 앱들끼리 데이터가 연결이 안 되어 있습니다
1:05 → 예를 들어서 메시지 앱은
1:07 → 메시지만 가지고 사용자를 이해를 해야 되고
1:09 → 전화 앱이나 갤러리는 각자 앱에 들어있는
1:12 → 콘텐츠만 가지고 사용자를 이해를 해야 되는데
1:14 → 좀 더 잘 이해를 하려고 하면
1:16 → 이것들을 엮어서 이해를 하는 것이 필요합니다
1:18 → 이런 다른 데이터들을 잘 엮어가지고
1:21 → 그걸 기반으로 사용자들을 잘 이해할 수 있을지
1:24 → 그런 기술들을 연구 개발을 하고 있습니다
1:26 → Q. 지식 그래프 기술이 무엇인가요?
1:28 → 그래프 하면 그냥 차트 이런 것들 생각하시는데
1:31 → 여기서 말하는 그래프는
1:33 → Node : 객체 표현 - Edge : 관계 표현
어떤 특정 노드하고 노드 간의 관계를 가지고
1:37 → 정보를 표현하는 방법이라고 보시면 됩니다
1:39 → 사람이 지식을 표현하는 방법이 되게 다양하게 있는데요
1:42 → 가장 쉬운 방법은 그냥
1:44 → 저희가 글로 쓰면 지식을 표현할 수 있고
1:47 → 글로 쓰면 사람들은 잘 이해할 수 있는데
1:50 → 컴퓨터는 이해하기 어렵습니다. 그러다보니깐
1:52 → 저희가 보통 엑셀 같은 이런 테이블 형식으로 정보들을 표현을 많이 합니다
1:57 → 아무래도 표 안에 정보를 채워 넣어야 되다 보니까 표현력이 되게 낮습니다
2:02 → 지식 그래프 / 객체 - 관계 - 객체
그래프라고 하는 것은 특정 노드들을 정의하고 관계를 이어줌으로 인해서
2:07 → 자연어보다는 못하지만
2:09 → 그런 테이블보다는 훨씬 풍부한 표현력을 가지고 있고요
2:12 → 지식 그래프의 유용성
Q. 소비자는 어떤 서비스를 기대할 수 있을까요?
2:14 → 앱들 간의 연결된 경험들을 제공을 해줄 수 있는데요
2:17 → 서치
예를 들어서 사람이 어떤 걸 찾아내려고 할 때
2:21 → 애매한 기억
제가 작년에 강릉에 가서 뭘 했는데
2:24 → 그때 분명히 내가 사진을 찍었는데 그게 뭐였지를
2:27 → 찾으려고 하면 되게 어렵습니다
2:29 → 힌트
그래서 애매한 시간 작년 장소
2:33 → 강릉인가 원주인가?
2:34 → 강원도?
2:35 → 그다음에 그때 내가 했던 어렴풋한 힌트가 주어졌을 때
2:39 → 시간 장소 그 힌트들만 가지고
2:42 → 연결
이렇게 다양한 데이터 소스들을 연결하다 보니까
2:45 → 정확한 어떤 서치 키워드가 없어도
2:48 → 아까 말씀드린 그래프라는 공간에서 해당되는
2:50 → 개체 노드들을 찾고
2:52 → 연결 관계들을 따라가다 보면
2:55 → 정확한 결과
원하는 컨텐츠 정확하게 찾아낼 수 있는
2:57 → 이런 것들이 가능해지게 됩니다
2:59 → 지식 그래프의 구조
Q. 지식 그래프를 시각화한다면?
3:01 → 동그란 다이어그램이 화살표 나가서
3:03 → 또 다이어그램이 연결되면 이런 구조라고 보시면 될 것 같습니다
3:06 → 이게 되게 간단한 구조이긴 한데
3:09 → 정말 다양한 정보들을 표현할 수가 있게 됩니다
3:11 → 예를 들어서 여기 A와 B라는 사람이 있다고 쳤을 때
3:15 → A가 제 아들이고 B도 제 아들이다
3:18 → 그러면 여러분들 바로 생각하실 수 있는 게
3:20 → 그러면 A와 B는 형제다
3:23 → 제가 방금 말씀드린 그 정보를
3:25 → 그래프 노드 두 개랑 엣지로 표현하게 되는 거고요
3:27 → 일일이 다 말을 안 해줘도
3:29 → 그런 새로운 지식들을 추론해 낼 수 있는
3:31 → 논리적 추론이라고 하는
3:32 → 이러한 기본 기술들이 깔려있다고 보시면 됩니다
3:35 → 이러한 기술은 확률 기반으로 값을 내는
3:38 → 생성형 AI와는 상호보완적 관계입니다
3:41 → 생성형 AI는 맥락에 따라 답변의 정확도가 높아지지만
3:46 → 학습 데이터의 한계로 인해 틀린 답을 내놓기도 하고
3:49 → 답이 나온 경로를 추적하기 어려운 경우도 있습니다
3:52 → 지식 그래프는 로직 기반으로 명확한 답을 제공하며
3:56 → 데이터 간의 연관 관계를 표현할 수 있지만
3:59 → 그래프를 완전하게 구성하기는 어렵습니다
4:02 → 때문에 이 두 기술을 결합하면
4:04 → 생성형 AI의 예측력과 지식 그래프의 정확성을 살려
4:08 → 시너지를 낼 수 있습니다
4:11 → Q. 지식 그래프 기술을 통해 투명성도 높아지나요?
4:13 → 명확하게 투명하게 다 추적해서 끄집어낼 수가 있습니다
4:17 → 그래서 그래프의 가장 큰 장점 중에 하나가
4:19 → 이런 설명 가능한 설명력이
4:22 → 가장 큰 장점 중에 하나라고 보시면 될 것 같습니다
4:25 → 그래서
4:26 → 절대 틀리면 안 되는
4:28 → 그런 절대적인 업무가 있고
4:30 → 그거를 기반으로 어떤 결정을 해야 된다고 하면 그때
4:33 → 지식 그래프 기반 기술이
4:34 → 가장 큰 힘을 발휘할 영역이라고 보시면 될 것 같습니다
4:36 → 기술 전망과 포부
Q. 삼성이 데이터 인텔리전스를 잘할 수 있는 배경은 무엇인가요?
4:39 → 우리 회사 같은 이런 단말
4:41 → 그리고 항상 집에서 같이 하고 있는 이런 가전제품을
4:44 → 같이 보유한 회사가
4:46 → 사용자를 가장 잘 이해할 수 있는
4:48 → 잠재력을 가지고 있다고 생각합니다
4:50 → 항상 품에 들고 다니는 핸드폰
4:51 → 항상 집에 있는 냉장고 세탁기 TV
4:56 → 그 사람의 일상을 같이하는 디바이스들을 가지고 있기 때문에
5:00 → 전 세계 어느 누구보다 사용자를 잘 이해하고
5:04 → 그 이해를 기반으로 정말 차별화된 서비스를
5:06 → 제공할 수 있는 잠재력을 가지고 있다고
저희는 생각을 하고 있습니다
5:10 → Q. 앞으로의 포부를 말씀해 주신다면?
5:13 → 데이터 인텔리전스의 어떤 흐름이
5:15 → 기존에는 단일 데이터들을 잘 분석해서
5:18 → 인사이트를 뽑아내는 것에서
5:20 → 이제는 연결하고 통합하는 쪽으로
5:22 → 확대가 되고 있다고 보고 있습니다
5:24 → 특히나 저희가 다루어야 될
5:27 → 사용자 데이터들은 형태가 제각각입니다
5:31 → 저희 사내 시스템들은 되게 정형화된
5:33 → 잘 짜여진 구성들인데
5:35 → 사용자의 데이터들은 변화무쌍하고
5:37 → 형태가 되게 불안정하기 때문에
5:41 → 이러한 불안정한 데이터들을 어떻게 잘 통합할 것이냐가
5:44 → 가장 중요한 시작점이라고 보고 있고요
5:47 → 근본 기술을 확보를 했으니
5:49 → 이걸로 데이터를 잘 연결해놓고 나서
5:51 → 그다음에 사용자에 대한 가치들을 만들어내는
5:54 → 이런 작업들을 이어서 진행을 해야 될 것 같다고
5:56 → 저는 보고 있습니다
5:59 → Interview Knowledge graph
Transcript
삼성전자, 데이터 인텔리전스 연구 집중: 사용자 맞춤형 AI 구현
데이터 인텔리전스(Data Intelligence)란?
- 사용자 데이터를 기반으로 사용자를 파악하고 맥락에 맞는 서비스를 제공하는 기술 전반.
- 핵심은 사용자가 남긴 데이터 흔적을 기반으로 사용자를 정확히 파악하고, 필요로 하는 것을 적시에 제공하는 것.
데이터 연결 기술의 중요성
- 현재 모바일 앱들은 데이터가 개별적으로 존재하며 앱 간 연결이 미흡.
- 예시: 메시지 앱은 메시지 데이터만, 전화 앱이나 갤러리는 각 앱 콘텐츠만 활용.
- 다양한 데이터를 연결하여 사용자를 더 깊이 이해하는 기술이 필요.
지식 그래프(Knowledge Graph) 기술
- 정의: 노드(객체)와 엣지(관계)를 통해 정보를 표현하는 방법.
- 사람의 지식 표현 방식을 컴퓨터가 이해하기 쉽게 구성.
- 테이블 형식보다 풍부한 표현력을 가짐.
- 구조: 객체 - 관계 - 객체.
지식 그래프의 유용성
- 앱 간 연결된 경험 제공.
- 예시:
- 문제: 작년 강릉 여행에서 찍은 사진을 찾고 싶지만, 정확한 정보가 기억나지 않음.
- 해결: 시간, 장소, 어렴풋한 힌트를 기반으로 다양한 데이터 소스를 연결하여 정확한 콘텐츠 검색 가능.
지식 그래프 시각화
- 동그란 다이어그램들이 화살표로 연결된 구조.
- 간단한 구조로 다양한 정보 표현 가능.
- 예시: A가 내 아들이고, B도 내 아들이라는 정보로부터 A와 B가 형제라는 관계 추론 가능.
- 논리적 추론 기술 기반.
지식 그래프 vs 생성형 AI
특징 | 지식 그래프 | 생성형 AI |
---|---|---|
기반 | 로직 기반 | 확률 기반 |
장점 | 명확한 답 제공, 데이터 간 연관 관계 표현, 설명 가능 | 맥락에 따른 답변 정확도 높음 |
단점 | 그래프 완전 구성 어려움 | 학습 데이터 한계로 틀린 답 제공 가능, 경로 추적 어려움 |
상호보완성 | 생성형 AI의 예측력과 지식 그래프의 정확성 결합 | |
지식 그래프의 투명성
- 답변 도출 과정을 명확하게 추적 가능.
- 절대적인 정확성이 필요한 업무에 적합.
삼성의 데이터 인텔리전스 강점
- 단말 및 가전제품을 모두 보유한 회사의 강점 활용.
- 핸드폰, 냉장고, 세탁기, TV 등 사용자의 일상을 함께하는 디바이스를 통해 사용자 이해도 높임.
- 차별화된 서비스 제공 잠재력 보유.
향후 포부
- 데이터 인텔리전스 흐름이 단일 데이터 분석에서 연결 및 통합으로 확대.
- 불안정한 사용자 데이터 통합이 중요.
- 근본 기술 확보 후 사용자 가치 창출에 집중.