找回密码
 注册
8月份电巢直播计划
查看: 62|回复: 0

如何从5W模式入手,助力内容审核

[复制链接]
  • TA的每日心情
    奋斗
    2019-11-19 15:09
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2020-7-31 14:41 | 显示全部楼层 |阅读模式

    EDA365欢迎您登录!

    您需要 登录 才可以下载或查看,没有帐号?注册

    x
    本帖最后由 fish1352 于 2020-7-31 14:43 编辑 0 V8 R* h+ ]* ?4 [6 H

    3 O" T# [& ?+ t+ `9 p; R0 X7 j

      w. r$ |* r* }% P, S
    + B& c4 }3 x3 r7 A* X$ U  I! F
    2 H( I4 I& d6 n

    7 g( K4 O! O8 k) y! \8 U 一、5W模式与内容审核 / G- T+ s5 l4 Q. b% y

    " I) }( l0 x( o! B/ M! L8 X! P% S 1948年,拉斯韦尔提出了传播过程及其五个基本构成要素,即:4 Z$ p$ M4 X; Q$ b6 ^6 g
    ( V3 ?; O) u% E- N! n
    • Who:谁——内容的生产者;  
    • What:内容——生产者说了什么;  
    • Which-In Which Channel:渠道——内容通过什么渠道传播;  
    • Whom-To Whom:受众——谁接受到了内容;  
    • With-With What Effect:效果——内容传播后取得了什么效果。 * {: I+ I( l# @7 X
    所有的传播行为都可以围绕这5个要素展开。
    2 o, e5 \) t! A; Z9 P0 ?2 W
    3 K6 H! T% m0 o, A 所谓内容审核,也不仅仅是对内容本身进行识别,尤其是在目前机器识别无法达到100%的准确、内容数量本身及其庞大的情况下,通过对各个传播要素的“监控”,也是完善机器审核的数据维度、提升审核效率的有效途径。$ q/ Z8 T5 G/ P! K; H
    3 Q1 o, a# r/ l" {
    5W要素应用到内容审核中,分别与以下角色环节相对应:; Q: z/ U" [$ I9 l# F$ S+ U) }

    # F% k2 m8 q& f( m1 `& g% h
    • Who:生产者是否靠谱?是否是一个“可信”的人?他发布不合规信息的可能性有多大?  
    • What:内容本身是否是合规的?  
    • Which:渠道想要做好“把关人”的角色,应该如何开展内容审核 ?  
    • Whom:受众本身有无异常?受众的行为是否合规(如发布不良评论)?  
    • With What Effect:传播的情况是否正常?
      2 p/ o4 A! |8 U+ t& d2 U- ~
    内容审核目前都是通过机器+人工的方式进行,审核的机制既可以是先发后审也可以是先审后发。
    ) @  z2 v5 o2 o0 |- J, V. _0 ?( ?/ u
    如何选择这些方式和机制、在提升审核效率的同时最大程度地保障内容安全、同时又不影响用户体验,维护三者的平衡,可以围绕上述各要素来进行规划设计。( i( a9 c+ A& {8 x  j# M! }" V

      k' c9 h! Z2 R. ~3 e% X+ b 二、五要素在内容审核中的应用 9 l1 s% l4 W2 f
    % {  X) x9 y! Z- X- L; K& C
      \% Q: p" q* X$ t0 U2 n

    9 y5 `0 j2 b) j9 A5 f. i 1. Who:对内容的生产者的风险评分和标签体系 ' T2 Q3 f* u6 f* g' v+ v: F
    5 W0 F5 A- x( l- l, k
    1)建立对于内容生产者的风险评分
    " d$ L$ f5 m# l3 T! E% p  O) n, S% S, }* {7 z* o+ F) z9 A: t
    从内容生产者发布第一条内容开始,就对他展开内容识别,基于静态的注册信息、此前的行为信息建立初步的风险情况后,根据其后续发布内容的情况动态实时调整,同时建立黑名单制度。
    7 p2 _+ a( ?* l$ Y( g
    5 ?. Q9 M6 w8 |3 | 如:一个内容生产者,此前浏览的内容都是财经、商务类型的,而且绑定了银行卡,则前期的静态评分可以认为他是一个低风险用户。
    ! U( A# T; y4 @, |
    * p+ i2 B+ z& Q0 t: Z 后续其发布的内容在一段时间内多次触发人工审核机制,则可以提高他的风险等级;随后他发布的内容被用户举报且人工审核确实违反了规则,则可以视情况将其纳入黑名单,限制之后的内容发布行为。
    ( b. ~: W9 n" n* M' O$ C5 |: x! _, q/ f1 P" b- |! n* `6 g
    2)建立对于内容生产者的标签体系6 p- W' c8 [) `" j/ p, A- D/ L/ [
    / ~2 v7 G; C! q$ }/ ~
    针对内容发布者进行画像,可以实现对异常行为的监控。/ |9 Q2 m, G( P$ q, s, \$ y5 o
    / z0 q; L) J/ L: |; N/ B
    标签体系可以包括用户的性别、年龄段、常用地理位置、常用设备、发布的内容类型等信息。一旦某些信息发生变化,则需要对其内容进行重点监控,防止异常行为,如用户被盗号后此账户被用来发布不合规内容。$ A% V. O, x' H: v  i6 R$ O, ]

    8 I% t/ t" C" H6 d& C6 `% w+ m 此外也可以设置优秀内容生产者等标签,对此类用户发布的内容免审核或可以先发后审。' V- G' G1 C& b$ b

    # R' Q" v$ g( a. K+ W 2. What:对内容的识别规则和手段 ; W% [+ c" A+ \- n3 ]! d
    ; x7 ~* G: R* Z- K7 p" ^4 Q. i; N
    建立内容审核的规则,审核的规则大体上来说源于监管的要求和业务的政策。" q+ L) E% D& S$ Z9 o
    ! M- p2 Z( @# I9 m/ _/ e* c7 v0 G% R
    1)监管的要求
    * D# O2 V! F% d/ _. d
    " ^4 x8 r. k/ C4 N3 R7 M9 Q 内容不能涉及黄赌毒暴政恐,《网络信息内容生态治理规定》、《网络短视频内容审核标准细则》等也对内容审核提出了详细的要求。8 p$ n. B3 L6 J* J# ^" }

    5 T+ {  t) `' G 2)业务的政策* F2 G  v1 N& j: u8 P
    4 y* Q- J9 P2 K+ l! [, t. B
    为营造社区的良好氛围,保证用户体验,内容不能涉及侵权、谩骂、隐私、低俗、垃圾内容等;为保障平台的正常运营和利益,不能违规发布广告、添加链接等;为社区用户安全考虑,内容不能涉及导流、诈骗等。' B* C- R8 q& K9 a
    3 C3 j2 r- f* X, ?
    3)丰富审核的技术手段; }7 T, f# U. o; |6 y) p
    2 v' n7 p; b* W  w$ a( h- t
    充分利用人工智能等技术手段,实现对文本、图片、声音、视频的自动识别,不断提高机器的召回率和准确率。
    : T# w1 R% I) C4 ^3 R/ f9 B
    % h% i: \; k; ~" k7 { 4)搭建机器审核和人工审核的流转机制4 _" V' ~( R, ?" ?2 N& Q$ j- n

    5 j8 r2 F6 l' E# h 包括内容在何种情况下触发审核、何种情况下触发人工审核,人工审核是否需要复核等,完善的流程设置对效率的提升大有助益。
    + _$ K5 b/ u2 D% \( R# ?2 u1 K9 W* P2 Q" N4 ?
    3. Which:助力审核人员扮演好“把关人”的角色   B" W/ r: O, ~( ^
    & w7 O# s2 i' u+ j! _( r
    1)设置有效的任务分配机制
    9 t2 _  X3 W4 h1 ^3 W  y3 P, d
    ' g) j3 l# H7 ]2 \ 提升分发效率和审核效率,保证需审核视频100%分发,且在最短时间内到达审核人员,同时按照一定的规则给审核人员分配需要审核的视频。( @2 M  p, Q4 J) e( j5 y4 ]4 z

    : w7 |; g8 L4 D! s" A; b6 w- l 按照触发人工审核的原因来分发,可以使审核人员积累在某一领域的审核经验,提升审核效率。
    1 `' S' L* C. k* j, E( g: j/ G- Z/ N& l# @/ a
    2)为审核人员提供配套的功能
    3 D/ i% G: P  @# \7 }. U0 r, ?& B/ x3 |3 o' m% f+ r
    “工欲善其事必先利其器”,提供审核的辅助功能,助力人工审核提速。3 Y5 \7 J/ C- s5 n4 k
    9 h/ |  w1 T# w$ o8 T# i# L
    如针对文本的审核对敏感词高亮显示,针对音视频的审核标注关键帧、设置倍速浏览功能,审核的信息通过信息流的方式自动呈现,减少操作点击环节。$ y5 s: _' z# O8 n1 b! U

    5 E6 A: v7 @7 f* s0 E7 h 4. Whom:通过受众识别违规内容的“蛛丝马迹” " b% H3 w# j& G

    * h' E" M' d. O+ a. e 1)为受众提供举报功能
    3 x7 }8 T% z5 ?& q2 `9 [
    $ l  R, }1 q8 x6 F- V/ V2 J 一方面可以节约审核资源,另一方面也是对机器和人工审核错误率的一种弥补。
    . {" B% [. x# ]: q, Z" F
    ! T# m2 A, ~; |6 P! ?0 | 2)建立受众的标签体系, L- A5 b$ x" I- ]

    * p- A* J# x" D$ N. ~3 ^& [ 和针对传播者的标签体系一样,对用户的画像除了用于针对用户的内容推荐外,也可以是对内容质量反馈的一个维度。
    4 ~4 J) H" t" i& V4 D) p* h5 w0 c# w& T$ g) G
    例如:同一个内容被大量不同标签的用户关注,可能内容本身存在了诱导行为,就需要人工审核予以确认。
    : K) |. ~, K9 V
      Y- B8 K, x; n. V 3)进行受众聚集情况分析
      G; h9 Q* c' B7 \& j) D; G5 i" Y) ]) T) |' _4 M6 y
    针对受众的集中情况进行分析,是否过于聚集。. x3 R- H8 b4 \1 w, r
    # a: g5 u/ s# I6 ~  _
    不过此方式多用于直播中刷量行为等的监控,在内容审核中,可以辅助判断内容是否存在诱导、违规广告营销等。
    0 H- |3 v" P5 C, A1 |1 h; ]1 K
    ; N. m* o4 W* r" d( ^4 |' f 5. With What Effect:通过传播的效果发现内容的异常
    ' [( \( i, x2 G+ D! R. a3 w2 \7 M" W
    1)通过观看、点赞、转发、评论数等的监控发现异常行为
    ! r" Q0 _' S% Z3 \, H6 a" G" i- g! }' E4 ]- L
    传播范围广泛的内容中若存在风险,造成的后果更为严重,因此要对观看、点赞、转发、评论量比较大的内容特别关注。; K! l& W4 R1 k6 [- l; c# N1 g

    . ]7 n% x# A  v1 X2 | 另外:这些指标的异常也是一个值得关注的风险点,此前点赞数一直不过百的用户新发布的内容突然点赞过万,可能需要对内容进行人工审核。
    % f+ T; ^' S- U1 h& |6 o8 x: v
    : M1 m$ A) i$ X# S 2)对评论进行内容识别
    7 x. }8 ~5 I5 j8 O: B- c8 Y: [0 m  l8 M
    - |% z1 r" w( g, x+ |) ?" f, s 评论同样是内容审核需要关注的部分,对评论内容的识别。9 I+ i! ~& y# t2 _+ x* Q. Y

    * f; O+ e8 I  H% _% b. c 一方面是监控评论是否有违规行为,另一方面通过关注评论内容中是否存在对内容本身的举报等,来进行内容审核。
    % Y, w: q7 k0 a- O; n1 x: U. g5 L; s7 H
    三、小结
    - w) u& N2 s- ]9 x4 C8 ~
    $ P4 P1 P' S- w; b& ]2 p2 } 从5W模式入手建立内容审核的体系,是基于传播要素的完整模式。
    : s( r6 J3 m  \- V
    1 ^5 E$ X1 F; Y3 C 内容审核的重点还是在对内容本身的识别方面,从提升机器审核的召回率和准确率,到提升人工审核的效率,再到搭建完整的流转机制,从其他要素着手也主要是为优化这三个环节来服务。
    ) T/ n6 ]3 J% m+ o7 k' I% T9 s+ J& T* C& f& p- d' o$ D6 d
    当机器能够实现对违规内容的100%精准识别,甚至具备了自我学习的本领,能够自己去拓展发现审核的“要义”,或许其他环节也就不那么必要了。. H* a5 B( C2 E5 v2 J' c* U

    4 f/ ]8 i/ q) ^7 h
    ) t- n5 F0 p. E! t5 X7 J- C5 s『本文转载自网络,版权归原作者所有,如有侵权请联系删除』
    您需要登录后才可以回帖 登录 | 注册

    本版积分规则

    关闭

    推荐内容上一条 /1 下一条

    EDA365公众号

    关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号 )

    GMT+8, 2020-8-7 08:50 , Processed in 0.781250 second(s), 21 queries , Gzip On.

    深圳市墨知创新科技有限公司

    地址:深圳市南山区科技生态园2栋A座805 电话:19925233282

    快速回复 返回顶部 返回列表